Question

我想使用具有322个变量和雏菊的59个可观测量的序数数据（1,2,3,4），最终导致聚类分析。我在excel输入文件（csv）上使用下面的脚本。菊花过后，会出现以下错误消息：

> Error in daisy(grb, stand = TRUE) :    ungültiger Typ character für
> Spaltennummern 1 In addition: Warning messages: 1: In data.matrix(x) :
> NAs introduced by coercion 2: In daisy(grb, stand = TRUE) :  
> Binärvariable 2, 3, 4,

grb数据包含第一列中的行名称和第一行中的列标题。雏菊似乎认为它必须使用第一列：我怎么能告诉它不要这样做？输入数据看起来不错。

其次，雏菊认为数据是二进制文件，但它们是oridnals，1-4。怎么纠正这个？非常感谢任何帮助。

脚本：

library(readr)
grb <- read_delim("~/R/Projects/Datasets/Ges.csv", 
                  ";", escape_double = FALSE, trim_ws = TRUE)
attach(grb)
library(cluster)
data(grb)
head(grb, 2)
d.d <- daisy(grb, stand = TRUE)
grb.hc <- hclust(d.d, method = "ward.D2")
library("factoextra")
fviz_dend(grb.hc, cex=.5, horiz = TRUE)

群集程序包中的菊花函数会返回数据错误

0 个答案: