我是一个非常初学者,并且可能很容易完成任务......
我做了一个k-means聚类和聚集的CO2足迹。我有5个集群,我想分析。有1012个个体。 对于这种情况,我创建了一个名为“capital_econ”的变量(之前我使用过PCA)。
我想检查一下群集在与capital_econ相关的平均值和中位数上是否有显着差异?我该怎么做?
我从t.test.cluster
找到了Package Hmisc
函数,但我没有得到“group”和“cluster”等等真正的意思。
帮助按钮告诉我的是:
set.seed(1)
y <- rnorm(800)
group <- sample(1:2, 800, TRUE)
cluster <- sample(1:40, 800, TRUE)
table(cluster,group)
t.test(y ~ group) # R only
t.test.cluster(y, cluster, group)
# Note: negate estimates of differences from t.test to
# compare with t.test.cluster