月度归档:2009年04月

MIT自然语言处理第五讲:最大熵和对数线性模型(第二部分)

自然语言处理:最大熵和对数线性模型
Natural Language Processing: Maximum Entropy and Log-linear Models 继续阅读

ACL09 Full Paper录用情况

  ACL会议(Annual Meeting of the Association for Computational Linguistics)是自然语言处理与计算语言学领域最高级别的学术会议,由计算语言学协会主办,每年一届。今年的ACL与IJCNLP(International Joint Conference on Natural Language Processing)联合举行,将在新加坡举办(ACL09),时间从8月2号到7号。 继续阅读

MIT自然语言处理第五讲:最大熵和对数线性模型(第一部分)

自然语言处理:最大熵和对数线性模型
Natural Language Processing: Maximum Entropy and Log-linear Models 继续阅读

WpMathEditor正式安家

  一直想将WpMathEditor提交给WordPress官网,但是最近一直没有时间来做这件事。不过昨晚发生的一件事有点搞笑,搞笑的同时又有点后怕,于是赶紧把这件事做了,免得以后WpMathEditor的身份被混淆,人有时候真是逼出来的! 继续阅读

自然语言处理中理性主义与经验主义的优缺点

  宗成庆老师的《统计自然语言处理》一书的序言二由冯志伟老师所写,序言中将自然语言处理中“理性主义与经验主义之争”这个话题放在了哲学中的“理性主义与经验主义之争”的大历史背景下,感觉写得很不错。这里做个节选,也算今天的一个偷懒吧! 继续阅读

欧洲议会平行语料库介绍

  平行语料库对于统计机器翻译(SMT)的研究至关重要,欧洲议会平行语料库是目前互联网上可免费获取的非常规范的平行语料库。本文主要根据欧洲议会平行语料库的英文主页介绍进行了粗略翻译,其时间跨度从1996年至2006年,目前这个语料库还在继续扩建中。 继续阅读

HMM学习最佳范例与崔晓源的博客

  “HMM学习最佳范例”与“崔晓源的博客”本来是不搭边的,由于自己花了几乎一个晚上浏览崔师兄的博客,没有时间写文章了,所以最终决定放在这里做成大杂烩,不过我觉得这个大杂烩还是有点价值的。 继续阅读

SMT经典再回首之Brown90:强大的作者阵容

  上次说到Brown当时是工作在IBM语音识别实验室的,我们还是先看看Google吴军“数学之美”系列中是如何介绍当时IBM华生实验室语音识别小组的,在“贾里尼克的故事和现代语言处理”中这样描述: 继续阅读