哪里可以找到可靠的K-medoid(非k-means)开源软件/工具?

时间:2011-10-05 20:03:32

标签: open-source cluster-analysis k-means

我正在学习K-medoids算法,所以如果我提出不恰当的问题,我很抱歉。据我所知,K-medoids算法实现了K-means聚类,但使用实际数据点作为质心而不是数学计算方法。

当我在网上搜索时,我发现了许多k-means工具,例如GenePattern,geWengh等等,但不是k-medoids工具。一些好朋友告诉我,在Matlab,还有一个由一些用户编写。但是,我担心个人实现的工具可能仍然存在一些缺陷或限制。因此,我想知道是否有一些广泛使用的可靠的开源软件/工具使用实际数据点作为集群的质心。我需要找出有关实际质心的信息,因此只返回聚类结果是不够的。我更喜欢在线网站,但如果不是这样,我可以将它安装到我的本地机器上。非常感谢,

3 个答案:

答案 0 :(得分:11)

  1. C Clustering LibrarysourceManual)中提供了C中的k-medoid implmentation。 (请注意,Cluster 3.0是此库的扩展,可能不提供k-medoids)

    从手册:

      
        

    在C群集库中,有三种分区算法可用:     •k-means聚类     •k-medians聚类     • k-medoids 聚类

      
  2. k-medoids in mlpy, Machine Learning library in Python

  3. k-medoids in Matlab

  4. k-medoids in Java

  5. k-medoids in C++

答案 1 :(得分:2)

<强>软件:

  • ELKI包括几种k-means变体,包括K-medoids和PAM。
  • GNU R包含k-means和“cluster”包中的“flexclust”包变体。
  • Gap一个关于基于距离的聚类的embrional开源库。

来源:http://en.wikipedia.org/wiki/K-medoids

答案 2 :(得分:0)

对于Python,我找到了一个实现PAM和Clara的包:PyCluster