K-Medoid(PAM)算法的缺点

时间:2017-10-01 15:55:11

标签: algorithm cluster-analysis data-mining k-means hierarchical-clustering

我研究过K-medoid算法(PAM)是一种基于分区的聚类算法和K-means算法的变种。它解决了K-means的问题,如产生空簇和对异常值/噪声的敏感性。

然而,K-medoid的时间复杂度是O(n ^ 2),不像K-means(Lloyd's算法),其时间复杂度为O(n)。我想问一下K-medoid算法除了时间复杂性之外还有其他缺点。

1 个答案:

答案 0 :(得分:0)

K-Medoid算法(PAM,CLARA或CLARANS)的主要缺点是它们不适用于对非球形(任意形状)的对象进行聚类。 这是因为它们依靠最小化非medoid对象和medoid(聚类中心)之间的距离-简而言之,他们使用紧凑性作为聚类标准而不是连通性。

PAM的另一个缺点是,由于第一个 k 个类固醇是随机选择的,因此对于同一数据集的不同运行可能会获得不同的结果。

除了上述缺点外,还必须预先指定 k 的值(簇数)。