减少auto-sklearn模型的大小

时间:2018-02-02 10:55:45

标签: python python-3.x machine-learning scikit-learn automl

我正在使用auto-sklearn根据某些数据生成回归模型。运行几个小时后,我将生成的模型保存到磁盘以供以后与joblib一起使用,生成的文件大小为2.5 GiB。

如何减少已保存模型的文件大小?我只需要能够在将来使用该模型进行预测。

1 个答案:

答案 0 :(得分:2)

根据您使用的型号类型,您绝对不可能。 如果你有这么大的模型,我猜它是神经网络或随机森林模型。不幸的是,没有简单的方法可以做到这一点,如果你这样做,你很可能会降低你的准确性。

对于神经网络,没有办法做到这一点,只是降低网络的复杂性。 对于随机森林,您可以查看树修剪,但我认为您不会获得大量的内存。

如果您的问题是:模型中是否有任何内容仅对我可以删除的培训有用=>也许是一些变量,没有什么大不值得花时间(最多几KB)。