让我们说我有一个像这样的线性回归模型
a <- rnorm(100)
b <- rnorm(100)
fit <- lm(a ~ b)
拟合对象是包含系数和数据以及拟合值等的列表。但是,如果我想预测看不见的数据,我只需要模型本身,所以基本上是系数。在这个实际上并不重要的例子中,但实际上我的模型(不必要地)有数百MB的大。
如何才能保留真正需要的东西来预测看不见的数据?
...仍然可以使用predict()
答案 0 :(得分:2)
你是对的,这个列表的一些元素可以用NULL代替。这不应影响预测,因此可以正确使用。您只需确保预测中不需要这些元素。
你可以这样做:
fit$data <- NULL
fit$y <- NULL
fit$linear.predictors <- NULL
fit$weights <- NULL
fit$fitted.values <- NULL
fit$model <- NULL
fit$prior.weights <- NULL
fit$residuals <- NULL
fit$effects <- NULL
此链接提供了更多详细信息。 http://blog.yhat.com/posts/reducing-your-r-memory-footprint-by-7000x.html