标签归档:TF-IDF

非主流自然语言处理——遗忘算法系列(四):改进TF-IDF权重公式

一、前言   前文介绍了利用词库进行分词,本文介绍词库的另一个应用:词权重计算。 … 继续阅读

发表在 自然语言处理 | 标签为 , , | 2条评论

如何计算两个文档的相似度(二)

上一节我们介绍了一些背景知识以及gensim , 相信很多同学已经尝试过了。这一 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , , , , , , , | 35条评论

如何计算两个文档的相似度(一)

前几天,我发布了一个和在线教育相关的网站:课程图谱,这个网站的目的通过对公开课的 … 继续阅读

发表在 Topic Model, 推荐系统, 自然语言处理 | 标签为 , , , , , , , , , , , , , , , | 14条评论