标签归档:中文信息处理

Mecab安装过程中的一些坑

先说一点题外话,最近发现 Linode 因为庆祝13周年活动将所有的Plan加了 … 继续阅读

发表在 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | 留下评论

用MeCab打造一套实用的中文分词系统(四):MeCab增量更新

最近在处理NLPJob的一些数据,发现之前训练的Mecab中文分词工具包还有一些 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , | 14条评论

用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese

我在Github上发布了一个MeCab中文分词项目: MeCab-Chinese … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 标注, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 10条评论

用MeCab打造一套实用的中文分词系统(二)

虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , | 25条评论

Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器

斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Jav … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , | 70条评论

北京森林工作室汉语句义结构标注语料库(BFS-CTC)共享资源

句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要, … 继续阅读

发表在 中文信息处理, 语料库 | 标签为 , , | 2条评论

哈工大语言技术平台(LTP)源代码正式对外共享

哈工大语言技术平台(LTP)源代码已经于6月1号正式对外共享,这对于广大致力于中 … 继续阅读

发表在 中文信息处理, 转载 | 标签为 , , , | 5条评论

中文机器翻译沙龙第五次活动小结

本次沙龙活动于3月27在清华科技园的泰为公司会议室举行。共有二十四人参加,包括来 … 继续阅读

发表在 机器翻译, 自然语言处理 | 标签为 , , , | 留下评论

Matrix67:漫话中文分词算法

注:这是今天在Matrix67上看到的关于中文分词的文章,粗略的读了一遍,觉得M … 继续阅读

发表在 中文信息处理, 中文分词, 转载 | 标签为 , , , , | 9条评论

代友转发:发起成立中文机器翻译定期学术沙龙

  以下文字代友Alex转发,如果哪位读者有水木帐号,恳请转载到“水木自然语言处 … 继续阅读

发表在 中文信息处理, 机器翻译, 自然语言处理 | 标签为 , , , | 19条评论