群集可以在层次聚类中重叠吗?

时间:2017-02-19 09:32:45

标签: r machine-learning statistics

Clustering result群集可以在层次凝聚聚类中重叠。我在R中实现了一个距离矩阵并绘制了聚类,但结果显示聚类重叠在另一个上。

library(rioja)

View(dissimilarity)

dissimilarity=as.dist(dissimilarity)

#diss=dist(dissimilarity,method='canberra')
clust1=chclust(dissimilarity,method = "coniss")     #To plot the dendogram using coniss method
#clust=chclust(dissimilarity,method = "conslink")    #To plot the dendogram using conslink method
plot(clust1,hang=-1)

#creating the hclust object to implement hierarchial clustering

hc = hclust(dissimilarity, method = 'ward.D')
y_hc = cutree(hc,6)
dissimilarity=as.matrix(dissimilarity)    #To convert diss into a data matrix  
# Visualising the clusters
library(cluster)
clusplot(dissimilarity,
         y_hc,
         lines = 0,
         shade = FALSE,
         color = TRUE,
         labels= 1,
         plotchar = FALSE,
         span = TRUE,
         main = paste('Clusters'),
         )

1 个答案:

答案 0 :(得分:2)

重叠聚类的印象可以基于可能的多维数据的2D图或者在错误使用函数语法时。包clusplot中的函数cluster使用prcompcmdscale,具体取决于参数diss为false或true,以减少维数。

根据help(clusplot)diss告诉函数,是否给出了函数的相异矩阵或观察矩阵。我的情况是,在没有设置diss = TRUE的情况下给函数赋予了相异矩阵。这可能是绘图功能的错误用法。