自然语言处理公司巡礼四:Systran

  每一个行业都有一个或屈指可数的几个巨头在引领潮流,比如操作系统领域是微软,搜索引擎领域是谷歌,视频领域是Youtube,而机器翻译领域的老大无疑是Systran!

Systran:机器翻译行业的拓荒者
  作为机器翻译行业最早的开发者和软件提供商,Systran于1968由Dr. Peter Toma创办。Peter Toma是一位科学家,当时恰好在美国乔治敦大学为美国政府的一个机器翻译项目工作,这个项目主要是为冷战时期(Cold war)美国空军将大量俄语的科技文档翻译成英语的需要服务的,之后他以美国乔治敦大学机器翻译系统研发小组为班底由创办Systran机器翻译公司。在“臭名昭著”的ALPAC报告公布后,来自于政府资助的机器翻译研究经费锐减,Systran是这个时候存活下来的为数不多的几个机器翻译系统之一!1986年,Systran被出售给法国巴黎的Gachot家族,并于2000年在法国证券交易所上市。
  Systran是目前应用最广泛﹑所开发的语种最丰富的翻译软件,可进行英语,繁体中文,简体中文,日语,韩语,西班牙语,法语,德语,意大利语,葡萄牙语,荷兰语,俄罗斯语,瑞典语,阿拉伯等13种语言的互译。它不但提供翻译技术给Yahoo!、AltaVista等大型搜寻引擎,更提供给美国空军(US Airforce)及欧洲联盟委员会(European Commission)使用。
  2002年,Systran在30多年积淀的基础上发布了一套完全重新设计的机器翻译技术架构。新的Systran技术包括:模块化(Modularity),有限状态技术(Finite State Technology),词典访问(Dictionary Access),声明化(Declarativity), 隐式转换(Implicit Transfer),交换格式(Exchange Format), 自然语言处理组件(NLP Components)。
  Google在07年10月之前也使用Systran的技术,但是07年下半年开始采用自己的技术,这与Google挖来统计机器翻译领域的天才人物Franz Joseph Och不无关系。Systran是老一代基于规则的机器翻译技术的商业化代表,而Google的机器翻译技术则将当前主流的语料库驱动的统计机器翻译推上前台,似乎预示着一个新的时代的开始!

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:
http://www.52nlp.cn/natural-language-processing-company-systran/

此条目发表在机器翻译, 自然语言处理, 随笔分类目录,贴了, , 标签。将固定链接加入收藏夹。

自然语言处理公司巡礼四:Systran》有 1 条评论

  1. Pingback引用通告: Thought this was cool: Beautiful Data-统计语言模型的应用一:缘起 « CWYAlpha

发表评论

电子邮件地址不会被公开。 必填项已用*标注