月度归档:2009年10月

第五届全国机器翻译研讨会后续

  第五届全国机器翻译研讨会已于10月16日至17日在南京大学举行完毕,虽未亲自参加整个会议,但是还是比较关注这次会议的一些情况。从师弟那里得知,明年由于COLING 2010在北京举行,将不再举办机器翻译研讨会。而后年由于第十三届机器翻译峰会将在厦门举行,第六届全国机器翻译研讨会将紧随机器翻译峰会在厦门举办。 继续阅读

“知行合一”与自然语言处理

  最近迷上了《明朝那些事儿》,周四从当当网收到寄过来的三、四、五册之后,本计划半个月的精神食粮就在这三天完成了,这也差点耽误了“我爱自然语言处理”的周末任务。不过还好,读《明朝那些事儿》的时候,王守仁(阳明)先生的“知行合一”给我留下了深刻的印象,且下意识的联想到了自然语言处理,于是就准备在这里瞎侃侃自己的感受了! 继续阅读

统计机器翻译文献阅读指南

  在《如何学习自然语言处理》中,关于阅读文献,nlpers的作者曾计划在之后的博客中列出一些领域的“必读(must reads”)文献,这的确是一个不错的对于初学读者有帮助的方法,不过nlpers的这个系列没能写出很多领域。 继续阅读

HMM学习最佳范例八:总结

八、总结(Summary)

  通常,模式并不是单独的出现,而是作为时间序列中的一个部分——这个过程有时候可以被辅助用来对它们进行识别。在基于时间的进程中,通常都会使用一些假设——一个最常用的假设是进程的状态只依赖于前面N个状态——这样我们就有了一个N阶马尔科夫模型。最简单的例子是N = 1。 继续阅读

如何学习自然语言处理

  nlpers上有几篇“Getting Started in X”,其中X分别是nlp(自然语言处理),summarization及sequence labeling,觉得写得不错,尤其是对初学者有一定借鉴意义,计划在这里分别结合自己的理解来介绍这几篇文章。本期介绍的是“如何学习自然语言处理(Getting Started in NLP)”,不过可惜nlpers目前仍不能访问,大家可以通过网页快照或者代理访问。 继续阅读

HMM学习最佳范例七:前向-后向算法5

七、前向-后向算法(Forward-backward algorithm)

  上一节我们定义了两个变量及相应的期望值,本节我们利用这两个变量及其期望值来重新估计隐马尔科夫模型(HMM)的参数pi,A及B: 继续阅读