我有一个RData文件,它是一个随机森林模型,大小为10Mb。我想将其转换为PMML,但是当使用R2PMML库时,这将创建一个350Mb的PMML文件,该文件远远不能使用。知道如何缩小尺寸吗?然后,我希望能够在python生产环境中使用PMML,因此需要将文件大大减小。
答案 0 :(得分:0)
可以通过指定compact = TRUE
转换选项来重新排列决策树数据结构:
library("r2pmml")
library("randomForest")
iris.rf = randomForest(Species ~ ., data = iris)
r2pmml(iris.rf, "RandomForestIris-compact.pmml", compact = TRUE)
但是,本地文件系统中PMML文件的大小并不能很好地指示其在运行时将消耗多少内存。正确加载后,您的350 MB文件可能适合50-75 MB的RAM(例如,文件中的100 MB为空格字符)。