识别与mahout群集相关的文档

时间:2013-02-20 15:23:35

标签: machine-learning cluster-analysis mahout

使用apache mahout创建doc向量和集群相当容易。执行clusterdump允许用户查看与各个群集关联的术语。但是,如何识别属于每个群集的文档?

谢谢

1 个答案:

答案 0 :(得分:0)

我认为,对于每个文档,找到每个聚类中心的向量的欧几里德距离,并将其分配给最近的聚类。