我已经使用非常大的数据集训练了一个来自Python Sckit Learn Module的RandomForestClassifier,但问题是如何才能保存这个模型并让其他人在它们的末端应用它。 谢谢!
答案 0 :(得分:24)
推荐的方法是使用joblib
,这将导致文件比泡菜小得多:
from sklearn.externals import joblib
joblib.dump(clf, 'filename.pkl')
#then your colleagues can load it
clf = joblib.load('filename.pk1')
请参阅online docs
答案 1 :(得分:4)
您是否尝试过使用Pickle模块挑选RandomForestClassifier
,然后将其保存到磁盘?
以下是基于pickle文档的示例:
import pickle
classifier = RandomForestClassifier(etc)
output = open('classifier.pkl', 'wb')
pickle.dump(classifier, output)
output.close()
然后“其他人”可以按如下方式重新加载腌制对象:
import pickle
f = open('classifier.pkl', 'rb')
classifier = pickle.load(f)
f.close()