R中的P值故障

时间:2013-08-09 21:12:01

标签: r anova p-value

我对p值有疑问。我一直在比较不同的线性模型,以确定一个模型是否优于另一个模型,在R中具有以下功能。

 anova(model1,model2)

不幸的是,偶尔它不会计算F或p值。这是一个没有给出p值的anova摘要的例子

 Analysis of Variance Table

 Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
 Model 2: Influence ~ SortedSums[, B]
    Res.Df   RSS Df Sum of Sq F Pr(>F)
 1    127 3090.9                      
 2    128 2655.2 -1    435.74 

为了对称性,这里也是一个产生p值的anova摘要。

 Analysis of Variance Table

 Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
 Model 2: Influence ~ SortedSums[, B]
    Res.Df    RSS Df Sum of Sq      F Pr(>F)
  1    127 3090.9                           
  2    128 3157.6 -1   -66.652 2.7386 0.1004

你知道为什么会这样吗?

2 个答案:

答案 0 :(得分:9)

并非所有问题都需要代码示例。你不应该因为新事而被嗤之以鼻,我很抱歉人们做到了。这是答案:

两种模型之间的差异并不显着。

以下是您可以采取的措施:

  • 检查以确保一个模型对象的术语是另一个模型对象的术语的超集。否则,默认的anova测试开始时无效(您可以使用AIC比较这些非嵌套模型,但这属于一个单独的问题)。我真的很好奇,看到一组嵌套的模型 非重要,但同样,没有必要回答这个问题。
  • 如果您选中了,并且模型是嵌套的,并且这是您手动执行的分析,请在报告中写入p = 1.0并将其称为一天。
  • 如果模型是嵌套的,上面的感觉就像作弊一样,这就是如何做到这一点。你真正要问的是anova,它们不同的一个变量是否对拟合有重要贡献。采用“更大”的模型并执行summary(BAR)。与BAR中存在但FOO中缺失的变量对应的p值是您的p值!并且它可能等于1.并且t统计量的平方是F值。
  • 如果模型是嵌套的并且这是分析,那么您正在以编程方式进行分析并且缺少p值会破坏脚本中的其他内容,只需执行anova(FOO,BAR)[,5:6]即可获得NA而不是空白。 ..但话又说回来,如果你以编程方式进行,你就会尝试过。
祝你好运!

答案 1 :(得分:0)

最近,在将带有一个断点的分段线性模型(带有分组的包)与没有断点的线性模型进行比较时,我也遇到了这个问题。简单线性模型是嵌套模型,因为断点之前的部分可以跨越整个数据集。

然而,分段拟合(由于性能原因我调用的收敛容差不大)报告了拟合,其中更复杂的分段模型的残差总和略大于简单线性模型。当然,更复杂的嵌套模型的最佳拟合不应该有更大的残差方差,并且anova函数报告的p值为NA。

在这种情况下,显然,更复杂的模型没有明显更好,p> 1。例如,alpha p = 1