Question

我正在使用R对数据进行分层聚类。我正在尝试从样本中尝试不同的变量，以便识别出可以提供有意义的聚类结果的变量。但是，我注意到，如果更改数据顺序，结果将有所不同。是因为var ctx = canvas.getContext('2d'); var img = new Image(); img.onload = function(){ canvas.width = img.naturalWidth canvas.height = img.naturalHeight ctx.drawImage(img, 0, 0); } img.src =的工作方式还是我错过了什么？

对于每个试验，我都会提取一定数量的列（在以下示例中，我使用了3、28、50、14列）。

hclust

当我更改行中列的顺序时：

my.data.final <- data.frame(read.csv("C:\\Final dataset-for R.csv"))

library(dplyr)
my.data.final <- my.data.final %>% mutate_if(is.character,as.factor)
my.data.final <- my.data.final %>% mutate_if(is.integer,as.factor)
my.data.final$Age <- factor(my.data.final$Age, ordered = TRUE)

my.data3 <- my.data.final[,c(3,28,50,14)]
my.data3 <- na.exclude(my.data3, row.names=1)
complete.cases(my.data3)

library(cluster)
dist.gower <- daisy(my.data3, metric = "gower")
aggl.clust.c <- hclust(dist.gower, method = "complete")
plot(aggl.clust.c,
     main = "Agglomerative, complete linkages")

我注意到树状图发生了变化。预计my.data3 <- my.data.final[,c(3,28,50,14)]会发生这种情况吗？我发现该行：

hclust

以某种方式影响结果，但我不确定为什么。

数据顺序重要吗？

0 个答案: