标签归档:Philipp Koehn

Moses最新版本发布

  统计机器翻译开源工具Moses的主要负责人之一Hieu Hoang,也是Moses代码的最大贡献者在3月28日的邮件列表里发布了一个通知“Moses release”,除了告知最新的Moses源代码包的下载地址外,还列出了自上一次发布之后的12点改进,这些改进来自于Moses开源社区许许多多开发者的贡献。以下是Hieu Hoang的全文: 继续阅读

Moses近期动态及其他

  由于工作的关系,有一段时间没有仔细关注过统计机器翻译开源系统Moses了。前些天看到哈工大郎君师兄的文章《钱老与Moses》以及近段时间有读者询问一些和Moses相关的问题,就又回到Moses的主页和它的邮件列表中找寻一些感觉。 继续阅读

一些自然语言处理及计算语言学相关的课件

  翻了一下自己的硬盘,整理了一些自然语言处理及计算语言学方面的课件,放在网络硬盘上做个备份,同时提供下载,估计对初学者比较有用。 继续阅读

统计机器翻译文献阅读指南

  在《如何学习自然语言处理》中,关于阅读文献,nlpers的作者曾计划在之后的博客中列出一些领域的“必读(must reads”)文献,这的确是一个不错的对于初学读者有帮助的方法,不过nlpers的这个系列没能写出很多领域。 继续阅读

自然语言处理公司巡礼七:Language Weaver

  这里曾经谈过机器翻译的行业老大Systran,今天再谈谈机器翻译行业的后起之秀Language Weaver!这两家公司相似的地方在于都源自于大学的实验室,Systran 是Peter Toma以美国乔治敦大学机器翻译系统研发小组为班底创办的,而Language Weaver背后则是统计机器机器翻译大牛Kevin Knight领导的美国南加州大学信息科学研究所(ISI/USC);不同的地方在于Systran的技术以基于规则的机器翻译方法为根基,而Language Weaver则在诞生之初就高举统计机器翻译大旗。 继续阅读

统计机器翻译英雄谱一:Franz Josef Och

  一直想写一下统计机器翻译领域的英雄谱,不过这方面自己把握的还不足。前些天计算所刘洋师兄在这里留言,可能有的读者没有注意到,他细数了几位SMT牛人的贡献,写得很好 继续阅读

欧洲议会平行语料库介绍

  平行语料库对于统计机器翻译(SMT)的研究至关重要,欧洲议会平行语料库是目前互联网上可免费获取的非常规范的平行语料库。本文主要根据欧洲议会平行语料库的英文主页介绍进行了粗略翻译,其时间跨度从1996年至2006年,目前这个语料库还在继续扩建中。 继续阅读

SMT经典再回首之Brown90:远见卓识

  最近在做毕业论文,又回头仔细阅读统计机器翻译(SMT)的相关论文。重读经典的过程发现了一些当初读的时候根本无法体会的东西,于是计划写一些心得感受,啰嗦之处,请读者见谅。本周计划写三篇关于Bown90的系列文章:远见卓识,统计机器翻译与语音识别,强大的作者阵容。 继续阅读

自然语言处理与计算语言学书籍汇总之五:机器翻译

  这里补充几本机器翻译方面的书籍,尤其值得关注的是统计机器翻译领军人物Philipp Koehn的《Statistical Machine Translation》,将在09年8月31号出版,目前在Amazon可以预定。 继续阅读