我正在使用clValid软件包中的功能clValid,并使用fanny
参数验证我的模糊聚类。
intvalid <- clValid(clust, 2:10, clMethods=c("fanny"),
validation="internal", metric='euclidean', maxitems = 1000)
但是,我想使用SqEuclidean
测试有效性,因此使用模糊C均值聚类而不是模糊聚类。我知道clValid中的fanny
算法来自群集程序包。我知道只有三个选项是欧几里得,相关和曼哈顿,因此没有办法将距离设置为SqEuclidean.
如何使用模糊C均值聚类执行clValid?还是我误解了clValid中fanny函数的metric
参数?
字符串,指定用于计算观察值之间的差异的度量。选项为“ euclidean”(默认),“ manhattan”和“ SqEuclidean”。欧几里得距离是差的平方根,曼哈顿距离是绝对差的和,而平方欧几里得距离“ SqEuclidean”是差的平方和。使用最后一个选项等效于(但速度稍慢)于所谓的“模糊C均值”计算。如果x已经是一个不相似矩阵,则此参数将被忽略。
数据
library(dplyr)
library(cluster)
library(clValid)
df<-iris[,-5] # I do not use iris, but to make reproducible
clust<-sapply(df,scale)