使用相异矩阵R的分层聚类

时间:2015-09-17 15:02:59

标签: r distance hierarchical-clustering r-daisy

我的数据类型矩阵 Data_string 大小(947 x 41)包含数字和分类属性。

我使用daisy()函数和Rstudio中的Gower距离度量生成了距离矩阵(947 x 947)。

d  <- daisy(Data_String, metric = "gower", stand = FALSE,type = list(symm = c("V1","V13") , asymm = c("V8","V9","V10")))

我使用相异矩阵(d)应用了层次聚类。

# hclust
hc <- hclust(d, method="complete")
plot(hc)
rect.hclust(hc, 4)
cut <- cutree(hc, k = 1:5)
View(cut)

#Diana
d_as <- as.matrix(d)
DianaCluster <- diana(d_as, diss = TRUE, keep.diss = TRUE)
print(DianaCluster)
plot(DianaCluster)

以下是我的情节。

Diana_plot

hclust_plot

**注意:我无法在此处上传图片,因为我没有足够的声望点。

我很难理解结果,任何人都可以

1-建议我可以在R中应用的任何解决方案,以简化对结果的理解。

2-我如何将其链接到我的源数据,因为所有结果都基于相异矩阵。

1 个答案:

答案 0 :(得分:0)

请看一下 - https://stats.stackexchange.com/questions/130974/how-to-use-both-binary-and-continuous-variables-together-in-clustering

它解释了如何使用gower相似矩阵和hclust。希望这有帮助!