Google、网易、百度在线翻译调查及分析

  机器翻译市场是一块大饼,目前很多大公司都已经进入或准备进入机器翻译市场。从已推出的在线翻译情况看,除了国外的Google、雅虎、微软外,08年下半年国内的百度、网易也推出了在线翻译产品,这也从另一个方面说明在线翻译有着很大的市场前景。以下是我针对Google,网易,百度的在线翻译情况调查及分析。
  网上关于在线翻译的调查情况已经有很多,这里我只想举三家在线机器翻译系统说明当前机器翻译发展趋势。首先需要指出的是Google公司,其在2004年挖来了统计机器翻译的领军人物Franz Josef Och,加上Google本身多年积累的网络文本资源和强大的技术优势,很快便推出了自己在线翻译系统(http://translate.google.com/translate_t),目前这个系统已经可以支持30多种语言之间的相互翻译。抛开其翻译质量,Google之所以可以迅速推出这么多种语言间的机器翻译,主要是利用了统计机器翻译的一个特点:只要有足够的双语句对齐语料库,便可以很快构建一个统计机器翻译系统,而无需特定语言学家的支持。当然,Google的在线翻译系统核心部分必然做了很多优化工作,我无从考证,但是从目前学术界的机器翻译评测报告中可以看出,Google的机器翻译研究无疑是领先的。
  其次可以看看国内的网易有道搜索,以下是摘自网络新闻一部分:
  “8月21日(注:2008年)消息,网易旗下有道搜索今日推出在线翻译服务测试版(http://fanyi.yodao.com),成为国内首家采用自主技术开发机器翻译的搜索引擎厂商。这也是自7月份谷歌、百度纷纷发力推广在线翻译服务后,又一家进入该市场的搜索厂商。从应用更为普及的互联网桌面词典软件入手,有道通过首创的网络释义和海量例句等创新功能在短短半年内已积聚500万装机用户,并试图将这一领先优势延展至在线翻译市场。至此,国内主流搜索厂商在翻译市场内的布局已成三足鼎立之势,竞争更趋激烈。”
  “有道翻译通过汇集数以亿计的中英文网页及文档,以整句为单位使用统计算法对原文进行多重模糊匹配,并结合语法规则进行优化与校正,从而形成相对准确的译文。”
  从报道中可以推断,网易有道所推出的在线翻译的核心部分是基于统计的机器翻译引擎
  这两家的情况还不足以说明机器翻译的发展趋势,但是如果结合当前学术界对统计机器翻译的追捧,加上其在机器翻译评测会议上的上佳表现,可以预见:统计机器翻译的应用是大势所趋
  百度公司在2008年7月11日推出自己的在线翻译服务(dict.baidu.com),事实上这是“百度词典翻译服务”的升级。它提供了中英、英中互译和单词查询功能,最多支持1000个汉字的长篇翻译服务,而百度词典在2004年上线,由百度与译典通Dr.eye合作推出。百度在线翻译则是与金桥翻译合作推出的。除了网上已知的这些情况,在试用百度翻译时,也会发现翻译结果后面有一行注解:以上结果由金桥翻译提供,你也可以选择一对一的人工付费翻译服务,获得更精确的信息内容。这表明,百度的在线翻译系统还是传统的基于规则的在线翻译系统(金桥翻译采用基于规则的机器翻译),或者严格意义上说百度还没有独立的在线翻译系统供用户使用。不过这仍可以说明百度已经认准了这个市场,在不能很快推出自己独立的在线翻译系统的情况下,和第三方合作也是一个暂时可取的办法,但不是长久之计。
  以上是三家提供搜索服务的公司的在线翻译情况调查,对于想进军在线翻译市场的公司来说,我觉得统计机器翻译是一个较好的选择,并且可以从两个方面入手以寻求突破:第一,从网络获取粗糙的双语对齐语料库,并进行高质量的分析和提取,并将其作为新的资源重新训练翻译模型和语言模型加入到统计机器翻译系统中,这对于提高翻译质量是高效和直观的;第二,即使是Google在机器翻译评测中遥遥领先,其在线翻译的结果对于用户来说多是“失望大于期望”,所以新的公司可以考虑避开“大杂烩”式的翻译,而将精力集中于一些翻译需求比较高的领域,如商务领域翻译、专业文献翻译,可以称之为“分类翻译”或“领域翻译”,因为专业领域的翻译往往可以采取与领域结合的语料库和多策略翻译方法,其翻译质量可以更好的满足用户需求,这样也就能针对不同领域抓住更多的忠实用户。

注:原创文章,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

本文链接地址:
http://www.52nlp.cn/online-translation-survey-and-analysis/

此条目发表在机器翻译分类目录,贴了, , , , 标签。将固定链接加入收藏夹。

Google、网易、百度在线翻译调查及分析》有 7 条评论

  1. raogaoqi说:

    即使是Google在机器翻译评测中遥遥领先,其在线翻译的结果对于用户来说多是“失望大于期望”

    真是件悲欣交集的事情啊:O

    [回复]

    52nlp 回复:

    所以我想说:机器翻译,多一点宽容
    http://www.52nlp.cn/%E6%9C%BA%E5%99%A8%E7%BF%BB%E8%AF%91%E5%A4%9A%E4%B8%80%E7%82%B9%E5%AE%BD%E5%AE%B9

    [回复]

  2. Rowson说:

    这篇文章可以做一下修改了

    我个人的使用过程中发现百度的规则机器翻译比有道要好。

    [回复]

    52nlp 回复:

    好老的文章都被你挖出来了,这些年有很大的变化,你要是有空欢迎在这里写一篇,呵呵。

    [回复]

  3. chen说:

    2014年了,个人感觉:
    百度的机器翻译最准确了,翻译结果的意义基本是对的,而Google和有道基本是逐词翻译的感觉,句子成分稍微复杂点,翻译的结果没法看,文理不通,几乎总是看不懂

    [回复]

    chen 回复:

    没有喷的意思,感觉中文太复杂,有些句子我们页分析不了,何况美国人,google结构类似的语言上的翻译结果的可读性挺好的。
    总之,中国人更懂中国话,

    [回复]

    52nlp 回复:

    “百度更懂中文”,呵呵

    [回复]

发表评论

电子邮件地址不会被公开。 必填项已用*标注