阅读背景:

用Hadoop1.0.3实现KMeans算法

来源:互联网 

从理论上来讲用MapReduce技术实现KMeans算法是很Natural的想法:在Mapper中逐个计算样本点离哪个中心最近,然后Emit(样本点所属的簇编号,样本点);在Reducer中属于同一个质心的样本点在一个链表中,方便我们计算新的中心,然后Emit(质心编号,质心)。但是技术上的事并没有理论层面那么简单。从理论上来讲用MapReduce技术实现KMeans算法是很Natural的想法:在Mappe




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: