在r

时间:2016-11-21 08:17:53

标签: r anova

我有七个小组,我想进行ANOVA测试,看看基于特征是否存在显着差异。我有大约600个特征。 我已经计算了每组和每个特征的平均值,标准偏差和方差。七组有不同的样本量。如何安排我的数据,以便我能够在R中运行它们?

1 个答案:

答案 0 :(得分:1)

set.seed(2)

sampledata <- expand.grid(group = paste0("group", 1:7), trait = paste0("trait", 1:600), value = 1:5)
sampledata$value <- rnorm(nrow(sampledata))

sampledata.aov <- aov(value ~ group * trait, data = sampledata)
anova(sampledata.aov)

Analysis of Variance Table

Response: value
               Df  Sum Sq Mean Sq F value  Pr(>F)  
group           6     7.1  1.1784  1.1670 0.32072  
trait         599   658.0  1.0985  1.0878 0.07096 .
group:trait  3594  3613.0  1.0053  0.9955 0.56604  
Residuals   16800 16964.3  1.0098                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

虽然有一个警告,即使是随机数字,当你一次拥有这么多特征时,你更有可能产生重大差异。