cmeans {e1071}与范妮{cluster}

时间:2016-12-09 08:58:30

标签: r fuzzy-c-means

我试图用尺寸为15' 000 x 7的数据集进行模糊k均值聚类。我首先尝试了函数fanny,它花了R差不多7个小时来得到一个结果(我也尝试了其他参数但是它总是很慢;样本为5&000,000行,大约需要半小时)。使用cmeans功能需要27秒。与范妮不同的是什么?以下是我设置这两个函数的方法:

fn <- fanny(training, k=40, memb.exp=1.3, metric="manhattan")
cn <- cmeans(training, 40, iter.max=500, dist="manhattan", method="cmeans", m=1.3)

结果会员资格相似但不相同。此外,计算中心的计算方式如何?在范妮我使用以下内容:

cent <- matrix(NA,40,ncol(training))
for (k in 1:40){
  cent[k,] <- colSums(fn$membership[,k]*training)/sum(fn$membership[,k]) 
}

将此应用于cmeans,我得到的结果与cmeans $ centers不同。

非常感谢!

0 个答案:

没有答案