我有这个线性回归问题,它有大约500-600个自变量。对于使用R的模型进行变量选择的最佳方法是什么。我目前正尝试使用' Olssr'进行逐步回归。在R中打包,但不断收到此错误:
>ols_all_subset(mylogit)
Error in matrix(r, nrow = len.r, ncol = count) :
invalid 'ncol' value (too large or NA)
In addition: Warning message:
In combn(n, r[i]) : NAs introduced by coercion to integer range
答案 0 :(得分:0)
根据olsrr文档,ols_all_subset
适合所有回归涉及一个回归量,两个回归量,三个回归量,等等。它测试了这组潜在自变量的所有可能子集。
对于500-600个变量,有2 ^ 500> 10 ^ 150种可能的组合,这将花费太多时间。对于逐步变量选择,请使用ols_stepwise