标签归档:gensim

中英文维基百科语料上的Word2Vec实验

最近试了一下Word2Vec, GloVe 以及对应的python版本 gens … 继续阅读

发表在 自然语言处理, 语义相似度, 语言模型 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , | 188条评论

Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语 … 继续阅读

发表在 数据挖掘, 机器学习, 科学计算, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | 11条评论

如何计算两个文档的相似度(三)

上一节我们用了一个简单的例子过了一遍gensim的用法,这一节我们将用课程图谱的 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , | 99条评论

如何计算两个文档的相似度(二)

上一节我们介绍了一些背景知识以及gensim , 相信很多同学已经尝试过了。这一 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 33条评论

如何计算两个文档的相似度(一)

前几天,我发布了一个和在线教育相关的网站:课程图谱,这个网站的目的通过对公开课的 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , | 14条评论