标签归档:Philipp Koehn

Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book

上午有同学在AINLP交流群里询问机器翻译书籍,看到后第一想到的就是Philipp Koehn大神,我读书的时候他活跃在统计机器翻译的一线,特别是他领导开源的Moses机器翻译工具,成了统计机器翻译时代的标配;现在他活跃在神经网络机器翻译的一线,这种一线,不仅仅指paper,还有代码,关注他的github,你会发现他还在为开源的神经网络机器翻译工具贡献代码。

2010年他出过一本SMT的专著:Statistical Machine Translation,这本书也有中文翻译版,个人觉得应该是机器翻译入门必读材料。这几年神经网络机器翻译风声水起,NMT伴随着深度学习的发展攻城略地,Koehn大神也为本书补充了一个专门的NMT章节,或者可以单独成书,关于这个章节,可以在这里找到和下载:https://arxiv.org/abs/1709.07809

Draft of textbook chapter on neural machine translation. a comprehensive treatment of the topic, ranging from introduction to neural networks, computation graphs, description of the currently dominant attentional sequence-to-sequence model, recent refinements, alternative architectures and challenges. Written as chapter for the textbook Statistical Machine Translation. Used in the JHU Fall 2017 class on machine translation.

或者可以在他维护的一个机器翻译课程相关页面上下载,这个主页上有很多已经开过的和再开的机器翻译课程信息:

http://mt-class.org/

最后,如果你觉得麻烦,欢迎关注AINLP公众号,后台回复 nmt 下载:

注:原创文章,转载请注明出处及保留链接“我爱自然语言处理”:http://www.52nlp.cn

本文链接地址:Philipp Koehn大神的神经网络机器翻译学习资料:NMT Book http://www.52nlp.cn/?p=11835

Start your future on Coursera today.

Moses最新版本发布

  统计机器翻译开源工具Moses的主要负责人之一Hieu Hoang,也是Moses代码的最大贡献者在3月28日的邮件列表里发布了一个通知“Moses release”,除了告知最新的Moses源代码包的下载地址外,还列出了自上一次发布之后的12点改进,这些改进来自于Moses开源社区许许多多开发者的贡献。以下是Hieu Hoang的全文: 继续阅读

Start your future on Coursera today.

Moses近期动态及其他

  由于工作的关系,有一段时间没有仔细关注过统计机器翻译开源系统Moses了。前些天看到哈工大郎君师兄的文章《钱老与Moses》以及近段时间有读者询问一些和Moses相关的问题,就又回到Moses的主页和它的邮件列表中找寻一些感觉。 继续阅读

Start your future on Coursera today.

一些自然语言处理及计算语言学相关的课件

  翻了一下自己的硬盘,整理了一些自然语言处理及计算语言学方面的课件,放在网络硬盘上做个备份,同时提供下载,估计对初学者比较有用。 继续阅读

Start your future on Coursera today.

统计机器翻译文献阅读指南

  在《如何学习自然语言处理》中,关于阅读文献,nlpers的作者曾计划在之后的博客中列出一些领域的“必读(must reads”)文献,这的确是一个不错的对于初学读者有帮助的方法,不过nlpers的这个系列没能写出很多领域。 继续阅读

Start your future on Coursera today.

自然语言处理公司巡礼七:Language Weaver

  这里曾经谈过机器翻译的行业老大Systran,今天再谈谈机器翻译行业的后起之秀Language Weaver!这两家公司相似的地方在于都源自于大学的实验室,Systran 是Peter Toma以美国乔治敦大学机器翻译系统研发小组为班底创办的,而Language Weaver背后则是统计机器机器翻译大牛Kevin Knight领导的美国南加州大学信息科学研究所(ISI/USC);不同的地方在于Systran的技术以基于规则的机器翻译方法为根基,而Language Weaver则在诞生之初就高举统计机器翻译大旗。 继续阅读

Start your future on Coursera today.

统计机器翻译英雄谱一:Franz Josef Och

  一直想写一下统计机器翻译领域的英雄谱,不过这方面自己把握的还不足。前些天计算所刘洋师兄在这里留言,可能有的读者没有注意到,他细数了几位SMT牛人的贡献,写得很好 继续阅读

Start your future on Coursera today.

欧洲议会平行语料库介绍

  平行语料库对于统计机器翻译(SMT)的研究至关重要,欧洲议会平行语料库是目前互联网上可免费获取的非常规范的平行语料库。本文主要根据欧洲议会平行语料库的英文主页介绍进行了粗略翻译,其时间跨度从1996年至2006年,目前这个语料库还在继续扩建中。 继续阅读

Start your future on Coursera today.

SMT经典再回首之Brown90:远见卓识

  最近在做毕业论文,又回头仔细阅读统计机器翻译(SMT)的相关论文。重读经典的过程发现了一些当初读的时候根本无法体会的东西,于是计划写一些心得感受,啰嗦之处,请读者见谅。本周计划写三篇关于Bown90的系列文章:远见卓识,统计机器翻译与语音识别,强大的作者阵容。 继续阅读

Start your future on Coursera today.

自然语言处理与计算语言学书籍汇总之五:机器翻译

  这里补充几本机器翻译方面的书籍,尤其值得关注的是统计机器翻译领军人物Philipp Koehn的《Statistical Machine Translation》,将在09年8月31号出版,目前在Amazon可以预定。 继续阅读

Start your future on Coursera today.