Question

我有七个小组，我想进行ANOVA测试，看看基于特征是否存在显着差异。我有大约600个特征。我已经计算了每组和每个特征的平均值，标准偏差和方差。七组有不同的样本量。如何安排我的数据，以便我能够在R中运行它们？

Answer 1

set.seed(2)

sampledata <- expand.grid(group = paste0("group", 1:7), trait = paste0("trait", 1:600), value = 1:5)
sampledata$value <- rnorm(nrow(sampledata))

sampledata.aov <- aov(value ~ group * trait, data = sampledata)
anova(sampledata.aov)

Analysis of Variance Table

Response: value
               Df  Sum Sq Mean Sq F value  Pr(>F)  
group           6     7.1  1.1784  1.1670 0.32072  
trait         599   658.0  1.0985  1.0878 0.07096 .
group:trait  3594  3613.0  1.0053  0.9955 0.56604  
Residuals   16800 16964.3  1.0098                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

虽然有一个警告，即使是随机数字，当你一次拥有这么多特征时，你更有可能产生重大差异。

在r

1 个答案: