如何解释R中ClustOfVar包的hclustvar函数的结果以进行特征选择?

时间:2019-03-29 03:17:58

标签: r tree feature-selection hierarchical-clustering

我正在使用层次聚类分析对Pima Indian Diabetes数据集的变量进行聚类。我将基于聚类分析进行特征选择。我知道我可以绘制树状图并看到类似的特征。但是,这将是一种任意选择。我想做更多的科学。当我检查结果时,有一个包含多个列表的列表,每个列表都有一些数字。 g和s列表中的相同变量有不同的数字。此外,还有X,Y,Z和W向量。我已经附上了结果的屏幕截图。这些数字代表什么?我可以从这些数字中了解选择变量的重要性吗?

df <- read_excel("excel file path")
str(df)
X <- subset(df, select = -Outcome)
X <- data.frame(apply(X, 2, as.numeric))
tree <- hclustvar(X)
plot(tree)

enter image description here

0 个答案:

没有答案