标签归档:统计机器翻译

Moses最新版本发布

AINLP

  统计机器翻译开源工具Moses的主要负责人之一Hieu Hoang,也是Moses代码的最大贡献者在3月28日的邮件列表里发布了一个通知“Moses release”,除了告知最新的Moses源代码包的下载地址外,还列出了自上一次发布之后的12点改进,这些改进来自于Moses开源社区许许多多开发者的贡献。以下是Hieu Hoang的全文: 继续阅读

机器翻译:多一点宽容

AINLP

  这两天“我爱自然语言处理”的一些访问来源于CSDN的推介,于是查了一下,发现与CSDN的一则新闻有关:《Google研发手机翻译软件 人类有望无需学外语》,里面除了原始新闻的简单摘译外,附加了Franz Och的介绍——引用了《统计机器翻译英雄谱一:Franz Josef Och》中的部分内容。 继续阅读

机器翻译新闻一则

AINLP

  今天在新浪科技上看到了“东芝开发智能手机英汉日翻译软件”这则新闻,比较感兴趣!虽然“统计机器翻译”这些年如火如荼,但是在商业化的道路上似乎还是老大哥“基于规则的机器翻译”更加成熟。比较感兴趣的是东芝这款产品是如何解决统计机器翻译所占的的资源问题,即使在PC上,SMT所占的资源有时都让人咋舌,所以感觉SMT更适合Google这类在线翻译模式,不知东芝是如何在手机上解决这个问题的。 继续阅读

HMM在自然语言处理中的应用一:词性标注4

AINLP

  在继续昨晚的工作之前,先聊两句Philip Resnik教授。作为美国马里兰大学的教授,他的主要研究领域是自然语言处理,不过最近他被美国某个网站评为“当代卫生保健领域最具创新性和最有影响力的百位革新者之一(the most creative and influential innovators working in healthcare today)" ,Resnik教授也非常吃惊(Much to my surprise),之所以入选,再于他利用自然语言处理来提高医用编码(medical coding)的水平,具体什么是医用编码我不太清楚,不过这项工作至少说明自然语言处理还是有相当的应用前景的。 继续阅读

第五届全国机器翻译研讨会后续

AINLP

  第五届全国机器翻译研讨会已于10月16日至17日在南京大学举行完毕,虽未亲自参加整个会议,但是还是比较关注这次会议的一些情况。从师弟那里得知,明年由于COLING 2010在北京举行,将不再举办机器翻译研讨会。而后年由于第十三届机器翻译峰会将在厦门举行,第六届全国机器翻译研讨会将紧随机器翻译峰会在厦门举办。 继续阅读

“知行合一”与自然语言处理

AINLP

  最近迷上了《明朝那些事儿》,周四从当当网收到寄过来的三、四、五册之后,本计划半个月的精神食粮就在这三天完成了,这也差点耽误了“我爱自然语言处理”的周末任务。不过还好,读《明朝那些事儿》的时候,王守仁(阳明)先生的“知行合一”给我留下了深刻的印象,且下意识的联想到了自然语言处理,于是就准备在这里瞎侃侃自己的感受了! 继续阅读

统计机器翻译文献阅读指南

AINLP

  在《如何学习自然语言处理》中,关于阅读文献,nlpers的作者曾计划在之后的博客中列出一些领域的“必读(must reads”)文献,这的确是一个不错的对于初学读者有帮助的方法,不过nlpers的这个系列没能写出很多领域。 继续阅读

LDC上免费的中文信息处理资源

AINLP

  著名的语言数据联盟LDC (Linguistic Data Consortium) 于1992年创办,由美国宾夕法尼亚大学主办,拥有众多的优质语言资源,对于自然语言处理及计算语言学的研究者来说,算得上是一座语言资源的金矿。不过其实行会员制,绝大部分语言资源需要收取一定费用,但是对于会员来说,费用相对低廉一些,因此世界上的许多大学及科研机构都是其会员,国内如哈工大、计算所等知名的自然语言处理研究单位也是其会员。 继续阅读

关注第五届全国机器翻译研讨会

AINLP

  去年11月底曾去自动化所参加了“第四届全国机器翻译研讨会”,印象深刻,并因此写了一篇《第四届机器翻译研讨会感受》。转眼间“第五届全国机器翻译研讨会”10月份就要在南京举行了,有兴趣的读者可以关注一下。 继续阅读