我有以下输入整数向量(示例):
4 138 233 461 610 621 669 742 814 827
89 138 334 656 697 810
138
138 196 738
659 738
4 461
138 337 756 810
8 138 196 337 468 663 664 756 809 810
它们都包含整数值[1-850]并且都存储在csv文件中。
我想根据向量中的相似性将它们分成多个集群,但我对如何在java中为输入数据实现k-means算法感到困惑。有谁愿意帮忙提供技巧或代码?
提前致谢。
答案 0 :(得分:0)
k-means聚类的伪代码
假设您有一个度量标准(让我们调用此M),它可以比较输入对象(在您的情况下为向量)并输出相似度量。
和一个函数(让我们称之为A),它能够计算输入对象集合的平均值