作者归档:itenyh

Itenyh版-用HMM做中文分词五:一个混合的分词器

        在上一节中,我们看到了HMM分词器的优势在于它的灵活性,能够联系 … 继续阅读

发表在 中文分词, 自然语言处理, 隐马尔科夫模型 | 4条评论

Itenyh版-用HMM做中文分词四:A Pure-HMM 分词器

先介绍一下使用的资源,分词使用的语料来自于SIGHAN Bakeoff 2005 … 继续阅读

发表在 中文分词, 自然语言处理, 隐马尔科夫模型 | 14条评论

Itenyh版-用HMM做中文分词三:前向算法和Viterbi算法的开销

上文中始终未提到前向算法与Viterbi算法,主要是因为想特意强调一下数学解不等 … 继续阅读

发表在 中文分词, 自然语言处理, 隐马尔科夫模型 | 4条评论

Itenyh版-用HMM做中文分词二:模型准备

本质上看,分词可以看做一个为文本中每个字符分类的过程,例如我们现在定义两个类别: … 继续阅读

发表在 中文分词, 隐马尔科夫模型 | 4条评论

Itenyh版-用HMM做中文分词一:序

前段时间仔细看了52nlp的关于隐马尔科夫模型(HMM)的介绍,深入浅出,真的是 … 继续阅读

发表在 中文分词, 隐马尔科夫模型 | 5条评论