memory-management - glmulti超大候选集

我遇到了同样的问题，这是我到目前为止所发现的：

行数似乎不是问题。问题在于，有150个预测器，包不能进行穷举搜索（即看一看并比较所有可能的模型）。根据我的经验，您的特定错误消息＆＃34; Oversized Candidate Set＆＃34;，是由您还允许成对交互（level=2，设置level=1以禁止交互）这一事实触发的。那么你很可能会遇到警告信息＆＃34;太多的预测因素＆＃34;。在我的（非常有限的）实验中，我发现我在候选集中工作的模型的最大数量是大约十亿个模型（具体地：30个协变量等于1,073,741,824，基于2 ^ n来计算可能的组合（n = 30））。）。这是我用来评估这个
的代码
out <integer(50) for(i in 2:40) out[i]<-glmulti(names(data)[1], names(data)[2:i], method="d", level=1, crit=aic, data=data)

一旦循环达到31个协变量，候选集返回0个模型。 33及以后它开始返回警告信息。我的数据＆＃34;有大约100个变量和大约1000行，但就像我说的问题是数据集的宽度而不是深度。
就像我说的那样，首先要消除相互作用，然后考虑首先使用其他变量减少技术来降低变量数（因子分析/主成分或聚类）。这些问题将失去一些可解释性，但保持预测能力。
glmuttil documentation将包与替代方案进行比较，同时突出显示其用例，优势和失败。

PS：我在Win7上运行了我的东西，64位，16GB Ram，R版本：3.10 glmutil 1.07。 PPS：据说该软件包的作者去年发布了2.0版本，可以解决其中的一些问题。阅读source