我正在努力为一年的数据集中的50000个客户制作每小时系数。 (365行* 28列)
我想保存这些系数,以便稍后在另一个R代码文件中进行预测。 目前,我正在为客户使用保存功能保存24小时模型列表。所以,50000 Rda文件(每个7mb)。然后,单独加载(加载函数)它们以使用R中的预测函数进行预测。
这样效率不高,现在我想为一百万客户做这件事,这需要花费大量的时间和空间。 有没有更好的方法来保存lm模型的系数,以便以后用于预测?
我尝试过biglm包,但它并没有在Rda文件上节省太多空间。 此外,在保存系数后手动乘以行将很困难,因为我有很多具有不同因子水平的变量。
谢谢!