使用R中的p值“前进”进入逐步回归

时间:2013-05-12 13:23:26

标签: r

请注意,上一个被标记为可能重复的问题并不重复,因为前一个问题涉及向后消除,此问题与前向输入有关。

我正在进行模拟,我想展示逐步回归是一种有偏差的估算器。特别是,以前的研究人员似乎使用了SPSS中的逐步程序之一(或与之相同的东西)。这涉及使用F值的p值进行r平方变化,以确定是否应将另一个变量添加到模型中。因此,为了使我的模拟结果具有最大影响,我需要在R中复制SPSS逐步回归过程。 虽然R有许多逐步程序(例如,基于AIC),但我发现的程序与SPSS不同。

我找到了function by Paul Rubin。它似乎工作,但功能的输入和输出有点奇怪。我开始调整它以便它(a)采用公式作为输入,(b)返回最佳拟合模型。函数的逻辑就是我所追求的。

我也在backwards stepwise regression找到了这个问题。请注意,向后条目与转发条目不同,因为向后条目删除了非重要条款,而向前条目则添加了重要条款。

尽管如此,如果现有的R包中有另一个功能可以做我想做的事情,那就太好了。

是否有R函数设计为使用F变化的p值执行正向逐步回归?

理想情况下,它可以将DV作为一组IV(作为命名变量或作为公式)和data.frame,并将返回逐步回归选择为“最佳”的模型。就我的目的而言,包含交互术语没有任何问题。

1 个答案:

答案 0 :(得分:1)

bioconductor包maSigPro中的函数two.ways.stepfor包含一种基于p值的正向逐步回归形式。

但是,可以指定alpha in和alpha out,它们必须相同。在SPSS中,alpha in和alpha out可以是不同的。

该软件包可以安装:

source("http://bioconductor.org/biocLite.R")
biocLite("maSigPro")