标签归档:聚类

PRML读书会第九章 Mixture Models and EM

Deep Learning Specialization on Coursera

PRML读书会第九章 Mixture Models and EM

主讲人 网络上的尼采

(新浪微博: @Nietzsche_复杂网络机器学习

网络上的尼采(813394698) 9:10:56
今天的主要内容有k-means、混合高斯模型、 EM算法。
对于k-means大家都不会陌生,非常经典的一个聚类算法,已经50多年了,关于clustering推荐一篇不错的survey:

Data clustering: 50 years beyond K-means。k-means表达的思想非常经典,就是对于复杂问题分解成两步不停的迭代进行逼近,并且每一步相对于前一步都是递减的。
k-means有个目标函数 :

假设有k个簇,是第k个簇的均值;每个数据点都有一个向量表示属于哪个簇,rnk是向量的元素,如果点xn属于第k个簇,则rnk是1,向量的其他元素是0。
上面这个目标函数就是各个簇的点与簇均值的距离的总和,k-means要做的就是使这个目标函数最小。 这是个NP-hard问题,k-means只能收敛到局部最优。
继续阅读

自然语言处理与世界杯

Deep Learning Specialization on Coursera

  自然语言处理与世界杯似乎没啥关系,不过今晚世界杯没有比赛了,我也可以回来照顾一下52nlp了。但是这两者的确没什么关系,我简单的Google了一下“自然语言处理 & 世界杯”,没有什么好的材料,就先从读者评论说起吧。 继续阅读