保存和加载线性模型系数以进行预测的更好方法

时间:2017-04-05 16:26:04

标签: r linear-regression predict rda bigdata

我正在努力为一年的数据集中的50000个客户制作每小时系数。 (365行* 28列)

我想保存这些系数,以便稍后在另一个R代码文件中进行预测。 目前,我正在为客户使用保存功能保存24小时模型列表。所以,50000 Rda文件(每个7mb)。然后,单独加载(加载函数)它们以使用R中的预测函数进行预测。

这样效率不高,现在我想为一百万客户做这件事,这需要花费大量的时间和空间。 有没有更好的方法来保存lm模型的系数,以便以后用于预测?

我尝试过biglm包,但它并没有在Rda文件上节省太多空间。 此外,在保存系数后手动乘以行将很困难,因为我有很多具有不同因子水平的变量。

谢谢!

0 个答案:

没有答案