我对p值有疑问。我一直在比较不同的线性模型,以确定一个模型是否优于另一个模型,在R中具有以下功能。
anova(model1,model2)
不幸的是,偶尔它不会计算F或p值。这是一个没有给出p值的anova摘要的例子
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 2655.2 -1 435.74
为了对称性,这里也是一个产生p值的anova摘要。
Analysis of Variance Table
Model 1: Influence ~ SortedSums[, Combos2[1, A]] + SortedSums[, Combos2[2,A]]
Model 2: Influence ~ SortedSums[, B]
Res.Df RSS Df Sum of Sq F Pr(>F)
1 127 3090.9
2 128 3157.6 -1 -66.652 2.7386 0.1004
你知道为什么会这样吗?
答案 0 :(得分:9)
并非所有问题都需要代码示例。你不应该因为新事而被嗤之以鼻,我很抱歉人们做到了。这是答案:
两种模型之间的差异并不显着。
以下是您可以采取的措施:
anova
,它们不同的一个变量是否对拟合有重要贡献。采用“更大”的模型并执行summary(BAR)
。与BAR
中存在但FOO
中缺失的变量对应的p值是您的p值!并且它可能等于1.并且t统计量的平方是F值。anova(FOO,BAR)[,5:6]
即可获得NA
而不是空白。 ..但话又说回来,如果你以编程方式进行,你就会尝试过。答案 1 :(得分:0)
最近,在将带有一个断点的分段线性模型(带有分组的包)与没有断点的线性模型进行比较时,我也遇到了这个问题。简单线性模型是嵌套模型,因为断点之前的部分可以跨越整个数据集。
然而,分段拟合(由于性能原因我调用的收敛容差不大)报告了拟合,其中更复杂的分段模型的残差总和略大于简单线性模型。当然,更复杂的嵌套模型的最佳拟合不应该有更大的残差方差,并且anova函数报告的p值为NA。
在这种情况下,显然,更复杂的模型没有明显更好,p> 1。例如,alpha p = 1