分类目录归档:语言模型

Beautiful Data-统计语言模型的应用二:背景

  本节我们进入《Beautiful Data》的正题,将沿着其第14章Peter Norvig大牛的“Natural Language Corpus Data”的轨迹介绍统计语言模型的三个应用:分词、解码及拼写检查。不过《Beautiful Data》中这三个应用依赖着Google的海量语言模型,所以Peter Norvig研究员首先介绍的也是Google语言模型的一些基本情况和背景。

发表在 语言模型 | 标签为 , , , , , , , , | 2 条评论

Beautiful Data-统计语言模型的应用一:缘起

  统计语言模型大概是自然语言处理中最简洁也最漂亮的模型了,在自然语言处理中,统计语言模型的应用包括语音识别、机器翻译、中文分词、拼写检查、语言识别、输入法等等,以至于Google科学家吴军老师的《数学之美》系列第一篇就介绍了统计语言模型。

发表在 自然语言处理, 语言模型 | 标签为 , , , , , , , , , , , | 2 条评论

Ubuntu 64位系统下SRILM的配置详解

  这篇文章是师弟YYL写给52nlp的。实验室机器的cpu是intel 64位的,而我安装的是Ubuntu8.10的32位版本,因此《Ubuntu8.10下moses测试平台搭建全记录》里的SRILM的编译方法只适用于32位的系统。师弟新装了Ubuntu 9.04 64位的桌面版,发现参照我的方法和其他人写的SRILM编译方法并不合适,而关于64位系统下编译SRILM的文章又很少,于是给52nlp写了这篇文章,这里非常感谢!

发表在 机器翻译, 语言模型 | 标签为 , , , , , , | 16 条评论

语言模型工具IRSTLM安装及试用手记

  Moses目前支持三个语言模型工具包:SRILM(The SRI language modeling toolkit),IRSTLM(IRST language modeling toolkit)和RandLM(the RandLM language modeling toolkit). SRILM我已经多次介绍过了,这里再介绍一下IRSTLM。

发表在 机器翻译, 语言模型 | 标签为 , , , , , | 11 条评论

语言模型训练工具SRILM详解

  SRILM是著名的约翰霍普金斯夏季研讨会(Johns Hopkins Summer Workshop)的产物,诞生于1995年,由SRI实验室的Andreas Stolcke负责开发维护。

发表在 机器翻译, 语言模型 | 标签为 , , , , , , , , | 29 条评论

MIT自然语言处理第三讲:概率语言模型(第六部分)

自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling

发表在 MIT自然语言处理, 自然语言处理, 语言模型 | 标签为 , , , , , , , , | 留下评论

MIT自然语言处理第三讲:概率语言模型(第五部分)

自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling

发表在 MIT自然语言处理, 自然语言处理, 语言模型 | 标签为 , , , , , | 一条评论

MIT自然语言处理第三讲:概率语言模型(第四部分)

自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling

发表在 MIT自然语言处理, 自然语言处理, 语言模型 | 标签为 , , , , , | 8 条评论

MIT自然语言处理第三讲:概率语言模型(第三部分)

自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling

发表在 MIT自然语言处理, 自然语言处理, 语言模型 | 标签为 , , , , | 4 条评论

MIT自然语言处理第三讲:概率语言模型(第二部分)

自然语言处理:概率语言模型 Natural Language Processing: Probabilistic Language Modeling

发表在 MIT自然语言处理, 自然语言处理, 语言模型 | 标签为 , , , | 3 条评论