月度归档:2009年09月

COLING 2010前瞻——规则与统计共舞,语言随计算齐飞

  这是无意在COLING 2010主页底下发现的一句主题语,觉得写得很有意思,就作为这篇文章的副标题了。COLING是ACL之外另一个自然语言处理与计算语言学界的顶级会议,全称国际计算语言学大会(International Conference on Computational Linguistics),每两年举办一次,第23届COLING会议将于2010年8月23日~27日在中国北京举行,由中文信息学会承办,以下是COLING 2010年征文全文,有兴趣的读者可以提前关注一下。 继续阅读

HMM学习最佳范例七:前向-后向算法4

七、前向-后向算法(Forward-backward algorithm)

  隐马尔科夫模型(HMM)的三个基本问题中,第三个HMM参数学习的问题是最难的,因为对于给定的观察序列O,没有任何一种方法可以精确地找到一组最优的隐马尔科夫模型参数(A、B、pi)使P(O|lamda)最大。因而,学者们退而求其次,不能使P(O|lamda)全局最优,就寻求使其局部最优(最大化)的解决方法,而前向-后向算法(又称之为Baum-Welch算法)就成了隐马尔科夫模型学习问题的一种替代(近似)解决方法。 继续阅读

第十二届机器翻译峰会后续

  第十二届机器翻译峰会已于8月26日至30日在加拿大渥太华举行完毕,而紧随其后,在同样的地点,NIST2009的机器翻译评测会议在8月31日至9月1日举行,但是从NIST2009机器翻译评测的计划来看,最终评测结果的公开版本将在10月30日发布,还需要等待一段时间。不过目前可知的一个结果是,计算所刘群老师所带领的自然语言处理研究组在汉英机器翻译评测项目中取得了总成绩第3名的好成绩,令人钦佩! 继续阅读

HMM学习最佳范例七:前向-后向算法3

七、前向-后向算法(Forward-backward algorithm)

  前向-后向算法是Baum于1972年提出来的,又称之为Baum-Welch算法,虽然它是EM(Expectation-Maximization)算法的一个特例,但EM算法却是于1977年提出的。那么为什么说前向-后向算法是EM算法的一个特例呢?这里有两点需要说明一下。 继续阅读

HMM学习最佳范例七:前向-后向算法2

七、前向-后向算法(Forward-backward algorithm)

  要理解前向-后向算法,首先需要了解两个算法:后向算法和EM算法。后向算法是必须的,因为前向-后向算法就是利用了前向算法与后向算法中的变量因子,其得名也因于此;而EM算法不是必须的,不过由于前向-后向算法是EM算法的一个特例,因此了解一下EM算法也是有好处的,说实话,对于EM算法,我也是云里雾里的。好了,废话少说,我们先谈谈后向算法。 继续阅读

ACL09 Full Paper各研究领域的录用情况

  本文转自水木社区的自然语言处理版,给出的是ACL09 Full Paper中各自然语言处理及计算语言学各研究领域论文的录用情况,包括投稿数、录用数及录用率。 继续阅读

自然语言处理相关工作的前景

  自然语言处理相关工作的前景怎样?虽然我不能直接回答这个问题,但是看看目前各大公司的招聘宣传就一目了然了,这里不妨关注一下百度、搜狗及维思比科技的招聘信息,首先声明这里不是为他们做广告。 继续阅读

HMM学习最佳范例七:前向-后向算法1

七、前向-后向算法(Forward-backward algorithm)

根据观察序列生成隐马尔科夫模型(Generating a HMM from a sequence of obersvations)

继续阅读

LDC上免费的中文信息处理资源

  著名的语言数据联盟LDC (Linguistic Data Consortium) 于1992年创办,由美国宾夕法尼亚大学主办,拥有众多的优质语言资源,对于自然语言处理及计算语言学的研究者来说,算得上是一座语言资源的金矿。不过其实行会员制,绝大部分语言资源需要收取一定费用,但是对于会员来说,费用相对低廉一些,因此世界上的许多大学及科研机构都是其会员,国内如哈工大、计算所等知名的自然语言处理研究单位也是其会员。 继续阅读