阅读背景:

Mahout学习——K-Means Clustering

来源:互联网 

      K-Means这个词第一次使用是在1967,但是它的思想可以追溯到1957年,它是一种非常简单地基于距离的聚类算法,认为每个Cluster由相似的点组成而这种相似性由距离来衡量,不同Cluster间的点应该尽量不相似,每个Cluster都会有一个“重心”;另外它也是一种排他的算法,即任意点必然属于某一Cluster且只属于该Cluster。当然它的缺点也比较明显,例如:对于孤立点敏感、产生最终聚类之间规模的差距不大。      K-Means这个词第一次使用是在1967,但是它的思想可以追溯到1957年,它是




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: