分类目录归档:中文信息处理

用MeCab打造一套实用的中文分词系统(四):MeCab增量更新

最近在处理NLPJob的一些数据,发现之前训练的Mecab中文分词工具包还有一些 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , | 14条评论

用MeCab打造一套实用的中文分词系统(三):MeCab-Chinese

我在Github上发布了一个MeCab中文分词项目: MeCab-Chinese … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 标注, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 10条评论

用MeCab打造一套实用的中文分词系统(二)

虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢 … 继续阅读

发表在 中文信息处理, 中文分词, 文本处理演示系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , | 25条评论

用MeCab打造一套实用的中文分词系统

MeCab是一套日文分词(形态分析)和词性标注系统(Yet Another Pa … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 32条评论

CIKM Competition数据挖掘竞赛夺冠算法陈运文

背景 CIKM Cup(或者称为CIKM Competition)是ACM CI … 继续阅读

发表在 中文信息处理, 数据挖掘, 文本分类, 机器学习, 自然语言处理, 计算语言学, 随笔 | 标签为 , | 19条评论

Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器

斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Jav … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , | 70条评论

中文分词入门之字标注法全文文档

将“中文分词入门之字标注法”这个系列整理成了一个PDF文档放到微盘中了,感兴趣的 … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , | 10条评论

北京森林工作室汉语句义结构标注语料库(BFS-CTC)共享资源

句义结构分析是汉语语义分析中不可逾越的重要环节,为了满足汉语句义结构分析的需要, … 继续阅读

发表在 中文信息处理, 语料库 | 标签为 , , | 2条评论

推荐《用Python进行自然语言处理》中文翻译-NLTK配套书

  NLTK配套书《用Python进行自然语言处理》(Natural Langu … 继续阅读

发表在 中文信息处理, 自然语言处理 | 标签为 , , , , , | 37条评论

欢迎大家试用信息学科数字化知识服务网络平台

  各位同学、老师、网友,大家好,由中科院自动化所综合信息中心承担、国 … 继续阅读

发表在 中文信息处理 | 6条评论