月归档:四月 2009

MIT自然语言处理第五讲:最大熵和对数线性模型(第二部分)

自然语言处理:最大熵和对数线性模型 Natural Language Processing: Maximum Entropy and Log-linear Models

发表在 MIT自然语言处理, 最大熵模型, 标注, 自然语言处理 | 标签为 , , , , , , , , | 7 条评论

ACL09 Full Paper录用情况

  ACL会议(Annual Meeting of the Association for Computational Linguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办,每年一届。今年的ACL与IJCNLP(International Joint Conference on Natural Language Processing)联合举行,将在新加坡举办(ACL09),时间从8月2号到7号。

发表在 自然语言处理, 计算语言学 | 标签为 , , , , , , , , , , | 4 条评论

MIT自然语言处理第五讲:最大熵和对数线性模型(第一部分)

自然语言处理:最大熵和对数线性模型 Natural Language Processing: Maximum Entropy and Log-linear Models

发表在 MIT自然语言处理, 最大熵模型, 标注, 自然语言处理 | 标签为 , , , , , , , , | 2 条评论

WpMathEditor正式安家

  一直想将WpMathEditor提交给WordPress官网,但是最近一直没有时间来做这件事。不过昨晚发生的一件事有点搞笑,搞笑的同时又有点后怕,于是赶紧把这件事做了,免得以后WpMathEditor的身份被混淆,人有时候真是逼出来的!

发表在 wordpress, 随笔 | 标签为 , , , | 2 条评论

自然语言处理中理性主义与经验主义的优缺点

  宗成庆老师的《统计自然语言处理》一书的序言二由冯志伟老师所写,序言中将自然语言处理中“理性主义与经验主义之争”这个话题放在了哲学中的“理性主义与经验主义之争”的大历史背景下,感觉写得很不错。这里做个节选,也算今天的一个偷懒吧!

发表在 自然语言处理, 转载 | 标签为 , , , , , | 留下评论

自然语言处理及计算语言学常见缩略语

  本文根据ACL Wiki上的“Acronyms – the ABCs of CL and NLP”进行翻译整理,个别缩略语把握不准没有翻译,欢迎补充!

发表在 自然语言处理, 计算语言学 | 标签为 , , , , | 3 条评论

欧洲议会平行语料库介绍

  平行语料库对于统计机器翻译(SMT)的研究至关重要,欧洲议会平行语料库是目前互联网上可免费获取的非常规范的平行语料库。本文主要根据欧洲议会平行语料库的英文主页介绍进行了粗略翻译,其时间跨度从1996年至2006年,目前这个语料库还在继续扩建中。

发表在 机器翻译, 语料库 | 标签为 , , , , , , | 6 条评论

单词也疯狂——漂亮的“单词云”

  单词计数应该是统计自然语言处理中一项基本的任务,MIT自然语言处理第二讲便是单词计数。一般来说,在一篇文章中,一个单词出现的次数越多,这个单词很可能就是这篇文章的关键词之一。

发表在 随笔 | 标签为 , , | 2 条评论

HMM学习最佳范例与崔晓源的博客

  “HMM学习最佳范例”与“崔晓源的博客”本来是不搭边的,由于自己花了几乎一个晚上浏览崔师兄的博客,没有时间写文章了,所以最终决定放在这里做成大杂烩,不过我觉得这个大杂烩还是有点价值的。

发表在 隐马尔科夫模型 | 标签为 , , , | 15 条评论

SMT经典再回首之Brown90:强大的作者阵容

  上次说到Brown当时是工作在IBM语音识别实验室的,我们还是先看看Google吴军“数学之美”系列中是如何介绍当时IBM华生实验室语音识别小组的,在“贾里尼克的故事和现代语言处理”中这样描述:

发表在 机器翻译 | 标签为 , , , , , , , , , , , , , | 4 条评论