Question

好，所以我正在上一门统计学课程（我是一名博士研究生），在R中执行方差分析时遇到了一些麻烦。代码如下：

df <- data.frame(
  x1 = c(-1, 1, -1, 1, -1, 1, -1, 1, -1, 1, -1, 1, -1, 1, -1, 1),
  x2 = c(-1, -1, 1, 1, -1, -1, 1, 1, -1, -1, 1, 1, -1, -1, 1, 1),
  x3 = c(-1, -1, -1, -1, 1, 1, 1, 1, -1, -1, -1, -1, 1, 1, 1, 1),
  y = c(59, 74, 50, 69, 50, 81, 46, 79, 61, 70, 58, 67, 54, 85, 44, 81)
)

我知道我可以用...进行方差分析

summary(aov(y ~ x1 + x2 + x3, data = df))

问题在于残留分析是错误的。它给我的SQR为474和12个自由度，但应分别为64和8。我对此很确定，因为我们不仅在课堂上与我的教授亲手做了（花了一段时间），而且还通过多种方法在Matlab中做到了这一点，并且得到了相同的结果。知道为什么R给我一个错误的答案吗？我尝试使用另一种方法，例如anova.lme，但没有成功。仅看自由度，如果我有16个实验并且计算出8个均值，那么我得到8 dfs。用另一种方式来看，我有16个实验和8个不同的组（每个归一化交互一个），这也给了我8 dfs。 SQR的自由度公式为N-k，其中k为不同的基团。在这种情况下，这些组都是可能的相互作用，因此16个实验-8个可能的相互作用= 8个自由度，这已经证明12个dfs是错误的（我不知道这12个dfs来自何处）。以下是我从R得到的答案，来自x1，x2，x3的SQG以及它们的自由度都是正确的。但是由于残差是错误的，所以我的F值也都关闭了。

我正在谈论的互动（组）是：

x1 x2 x3
-1 -1 -1;
 1 -1 -1;
-1  1 -1;
 1  1 -1;
-1 -1  1;
 1 -1  1;
-1  1  1;
 1  1  1;

下面是我从R那里得到的答案

        Df Sum Sq Mean Sq F value   Pr(>F)    
x1           1   2116  2116.0  53.570 9.23e-06 ***
x2           1    100   100.0   2.532    0.138    
x3           1      9     9.0   0.228    0.642    
Residuals   12    474    39.5

感谢您的帮助，对于任何错误，抱歉，英语不是我的主要语言。

Answer 1

在这里，您将x1，x2和x3建模为单独的协变量，但您似乎希望将其合并为一个因子。您可以使用R中的interaction()函数来做到这一点。例如

summary(aov(y ~ interaction(x1, x2, x3), data = df))
#                         Df Sum Sq Mean Sq F value   Pr(>F)    
# interaction(x1, x2, x3)  7   2635   376.4   47.05 7.07e-06 ***
# Residuals                8     64     8.0                     
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

似乎提供了您期望的值基本上，它将为您创建具有8个不同值的新变量

with(df, table(interaction(x1, x2, x3)))
# -1.-1.-1  1.-1.-1  -1.1.-1   1.1.-1  -1.-1.1   1.-1.1   -1.1.1    1.1.1 
#        2        2        2        2        2        2        2        2

R中的Anova具有重复

1 个答案: