使用r2PPML将10Mb Rdata文件转换为PMML,可以得到350Mb PMML文件。如何缩小尺寸?

时间:2019-04-02 13:13:55

标签: python r random-forest pmml rdata

我有一个RData文件,它是一个随机森林模型,大小为10Mb。我想将其转换为PMML,但是当使用R2PMML库时,这将创建一个350Mb的PMML文件,该文件远远不能使用。知道如何缩小尺寸吗?然后,我希望能够在python生产环境中使用PMML,因此需要将文件大大减小。

1 个答案:

答案 0 :(得分:0)

可以通过指定compact = TRUE转换选项来重新排列决策树数据结构:

library("r2pmml")
library("randomForest")
iris.rf = randomForest(Species ~ ., data = iris)
r2pmml(iris.rf, "RandomForestIris-compact.pmml", compact = TRUE)

但是,本地文件系统中PMML文件的大小并不能很好地指示其在运行时将消耗多少内存。正确加载后,您的350 MB文件可能适合50-75 MB的RAM(例如,文件中的100 MB为空格字符)。