我想将16个连续(7点李克特量表)变量聚类为三个不同的类别,然后使用因子对其运行ANOVA。目前,我遇到了将变量聚类在一起的问题,因此它可以作为ANOVA运行。 这是我到目前为止所做的。
> class(test)
data.frame
> colnames(test)
[1] "S1" "S2" "S3" "S4" "S5" "S6" "S7" "S8"
[9] "S9" "S10" "S11" "S12" "S13" "S14" "S15" "S16"
[17] "Condition"
> lapply(test[,1:16], class)
numeric
> class(test$Condition)
factor
如何将变量聚集在一起 - 比如S1-5,S6-10,S11-16-并使用因子测试$ Condition作为自变量?
答案 0 :(得分:0)
我没有代码在我身上,但最初我的目标是使用一种复杂的方法将变量聚集在一起并且错误最少。相反,我在组合变量时选择了两种方法:1)平均组; 2)总结小组。然而,应该注意,所选择的方法对输出有影响(即β权重,边际均值等) - p值保持不变。
答案 1 :(得分:0)
# this function give you the number of clusters as variable n in R # # programming test your datastes.
clusrer.data <- function(test,n) {
data <- t(test)
z <- rbind(data)
(cl <- kmeans(z, n))
cl
}
clusrer.data(test, 3)# give you 3 clusters each cluster have 5 features.