HCPC r功能 - 群集数据和群集可视化之间的差异

时间:2017-04-26 19:41:06

标签: r hierarchical-clustering dendrogram

我使用 FactoMiner 包及其功能 HCPC 来创建一些观察的细分。然后我使用函数 plot.HCPC(),我观察了这个函数的两个替代方案之间的差异(两个替代方案说明了相同的结果......)

library(FactoMineR) data(USArrests) pca <- PCA(USArrests, ncp = 3, graph = FALSE) hcpc <- HCPC(pca, graph = FALSE)

如果我使用choice = 'map',我们会看到阿肯色州位于绿色群集中,但如果我使用choice = 'tree',那么 Arkansas 就在红色集群! (绿色星团的其他状态保持在从地图到树状图/树的绿色群集中):

plot(hcpc, choice = 'map') plot(hcpc, choice = 'tree')

enter image description here

根据数值结果(hcpc$data.clust),在cluster3(绿色群集)中有8个观察值,它们匹配&#39; map&#39;可视化(但不是树形图/树形可视化)。 如果我错过了重要的事情,你知道我做错了吗?

1 个答案:

答案 0 :(得分:1)

在HCPC函数中,第一个参数之一是Consol = T:

  

Consol一个布尔值。如果为TRUE,则执行k均值合并   (如果使用kk并且等于数字,则无法执行合并。)

library(FactoMineR) 
 data(USArrests)
 pca <- PCA(USArrests, ncp = 3, graph = FALSE)
 hcpc <- HCPC(res.pca,consol=F, graph = FALSE)
 plot(hcpc, choice = 'map')
 plot(hcpc, choice = 'tree')

factor map

tree

希望它能帮到你