r - 如何解释R中ClustOfVar包的hclustvar函数的结果以进行特征选择？

我正在使用层次聚类分析对Pima Indian Diabetes数据集的变量进行聚类。我将基于聚类分析进行特征选择。我知道我可以绘制树状图并看到类似的特征。但是，这将是一种任意选择。我想做更多的科学。当我检查结果时，有一个包含多个列表的列表，每个列表都有一些数字。 g和s列表中的相同变量有不同的数字。此外，还有X，Y，Z和W向量。我已经附上了结果的屏幕截图。这些数字代表什么？我可以从这些数字中了解选择变量的重要性吗？

df <- read_excel("excel file path")
str(df)
X <- subset(df, select = -Outcome)
X <- data.frame(apply(X, 2, as.numeric))
tree <- hclustvar(X)
plot(tree)

如何解释R中ClustOfVar包的hclustvar函数的结果以进行特征选择？

0 个答案: