分类目录归档:中文分词

Mecab安装过程中的一些坑

先说一点题外话,最近发现 Linode 因为庆祝13周年活动将所有的Plan加了 … 继续阅读

发表在 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | 留下评论

用MeCab打造一套实用的中文分词系统(四):MeCab增量更新

最近在处理NLPJob的一些数据,发现之前训练的Mecab中文分词工具包还有一些 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , | 14条评论

用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese

我在Github上发布了一个MeCab中文分词项目: MeCab-Chinese … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 标注, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 10条评论

用MeCab打造一套实用的中文分词系统(二)

虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , | 25条评论

HMM相关文章索引

HMM系列文章是52nlp上访问量较高的一批文章,这里做个索引,方便大家参考。 … 继续阅读

发表在 中文分词, 标注, 自然语言处理, 隐马尔科夫模型 | 标签为 , , , , , , , , , , , , | 一条评论

用MeCab打造一套实用的中文分词系统

MeCab是一套日文分词(形态分析)和词性标注系统(Yet Another Pa … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 32条评论

Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器

斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Jav … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , | 70条评论

中文分词入门之字标注法全文文档

将“中文分词入门之字标注法”这个系列整理成了一个PDF文档放到微盘中了,感兴趣的 … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , | 10条评论

中文分词入门之字标注法4

上一节主要介绍的是利用最大熵工具包来做字标注中文分词,这一节我们直奔主题,借用条 … 继续阅读

发表在 中文分词, 条件随机场 | 标签为 , , , , , , , , , , , , , , , , , , | 41条评论

中文分词入门之字标注法3

最近要整理一下课程图谱里的中文课程,需要处理中文,首当其冲的便是中文分词的问题。 … 继续阅读

发表在 中文分词, 最大熵模型 | 标签为 , , , , , , , , , , , | 9条评论