是否可以从GBM拟合模型中删除数据?我知道keep.data
选项。但是,我希望能够在处理过程中保留数据,然后减少数据量。另外,如果我想保留一棵树用于未来的预测(让我们说在填充1000棵树之后,我决定500棵树在我的情况下效果最好,所以我只想保留这棵树有没有一种安全的方法可以从拟合的模型中删除多余的数据,而不会影响预测新数据的能力?
答案 0 :(得分:0)
我认为唯一真正有用的方法是按照你的建议删除多余的树木。
如果我在gbm示例中运行以下命令,我会发现树占对象大小的80%,数据占10%。因此,删除多余的树木可以节省大量空间。
library(pryr)
bit <- unlist(lapply(gbm1,object_size))
round(bit/sum(bit),3)
您也可以尝试压缩对象,这会显着缩小对象的大小。
memCompress(serialize(gbm1, NULL), "bzip2")
unserialize(memDecompress(gbm1, type = "bzip2"))