我在R包'leaps'中的92个变量上运行所有可能的回归模型,预测一个因变量。这些变量中的每一个都包含51个数值。
Leaps产生五个模型统计量(即r平方,经调整的r平方,残差平方和,Mallow的Cp和BIC)。我的结果显示每个统计数据看似正常的值,除了Mallow的Cp,其中所有值都是负无穷大。很明显,除了某些点之外还有零除,但我对模型拟合统计数据不够熟悉,不知道这是否是一个问题。
有什么想法?
答案 0 :(得分:0)
我刚刚被介绍给Mallow的Cp,但听起来你有比数据点更多的变量。 s ^ 2是完整模型的MSE(包含所有变量)。但由于您拥有的变量多于数据点,因此数据完全符合无关变量。因此,您应该收集更多数据或找到减少Mallow Cp以外的变量数量的方法。
Cp = RSS / s ^ 2 + N - 2 * p
s ^ 2 =完整模型的MSE。
您可以在此处查看此参考:http://www.public.iastate.edu/~mervyn/Stat401E_Spring2013/Other/mallows.pdf