我正在使用R来选择最合适的模型。
我有15个变量,样本大小为790,000。线性模型不起作用b / c残差不是随机的和非正常的。
所以我尝试用更高的多项式和相互作用来运行非线性模型。但是,由于数据集较大,R非常慢并且会不时关闭。
我尝试使用逐步函数,polym函数,但两者都不理想。是否存在高阶多项式和相互作用的函数/包?如果我要写一个循环,如何在不查看绘图的情况下检查每个场景的残差的正态性和随机性? (夏普测试不适用于b / c大样本量)。非常感谢你!
更新: fit2b&lt; - lm(f $ Assets~polym(f $ C,f $ Suc,f $ SP,f $ SS,f $ Qual_P, f $ A,f $ TotalAA,f $ Eq,f $ D,f $ PE,f $ EI,f $ GE,f $ EO,degree = 5,raw = TRUE)+ f $性别+ f $ LT)< / p>
fit1b = lm(f $ Assets~f $ A)
step(fit1b,scope = list(upper = fit2b,lower = ~1),direction =&#34; forward&#34;,trace = FALSE)
另外,我想知道除了vif之外是否还有其他工具来检测多重共线性,我应该如何调整模型来解决它。