标签归档:自然语言处理

自然语言处理工具包spaCy介绍

spaCy 是一个Python自然语言处理工具包,诞生于2014年年中,号称“I … 继续阅读

发表在 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , , | 自然语言处理工具包spaCy介绍已关闭评论

非主流自然语言处理——遗忘算法系列(四):改进TF-IDF权重公式

一、前言   前文介绍了利用词库进行分词,本文介绍词库的另一个应用:词权重计算。 … 继续阅读

发表在 自然语言处理 | 标签为 , , | 2条评论

非主流自然语言处理——遗忘算法系列(三):分词

一、前言   前面介绍了词库的自动生成的方法,本文介绍如何利用前文所生成的词库进 … 继续阅读

发表在 自然语言处理 | 标签为 , , , , | 18条评论

非主流自然语言处理——遗忘算法系列(二):大规模语料词库生成

一、前言   本文介绍利用牛顿冷却模拟遗忘降噪,从大规模文本中无监督生成词库的方 … 继续阅读

发表在 自然语言处理 | 标签为 , , , , | 12条评论

非主流自然语言处理——遗忘算法系列(一):算法概述

一、前言   这里“遗忘”不是笔误,这个系列要讲的“遗忘算法”,是以牛顿冷却公式 … 继续阅读

发表在 自然语言处理 | 标签为 , , | 留下评论

Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器

斯坦福大学自然语言处理组是世界知名的NLP研究小组,他们提供了一系列开源的Jav … 继续阅读

发表在 中文信息处理, 中文分词, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , | 70条评论

如何计算两个文档的相似度(三)

上一节我们用了一个简单的例子过了一遍gensim的用法,这一节我们将用课程图谱的 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , | 99条评论

“翻译技术沙龙”第十三次活动详情与小结

本次活动在外研社大厦的第四会议室举行,共有近40人参加,其中包括来自北京大学、北 … 继续阅读

发表在 机器翻译 | 标签为 , , | 留下评论

EMNLP-CoNLL 2012 List of accepted papers

EMNLP-CoNLL 2012(Conference on Empirical … 继续阅读

发表在 自然语言处理, 计算语言学 | 标签为 , , , , , , , | 留下评论

推荐《用Python进行自然语言处理》中文翻译-NLTK配套书

  NLTK配套书《用Python进行自然语言处理》(Natural Langu … 继续阅读

发表在 中文信息处理, 自然语言处理 | 标签为 , , , , , | 37条评论