标签: machine-learning cluster-analysis mahout
使用apache mahout创建doc向量和集群相当容易。执行clusterdump允许用户查看与各个群集关联的术语。但是,如何识别属于每个群集的文档?
谢谢
答案 0 :(得分:0)
我认为,对于每个文档,找到每个聚类中心的向量的欧几里德距离,并将其分配给最近的聚类。