将分类转移到生产环境

时间:2015-01-22 19:39:12

标签: python machine-learning scikit-learn classification pmml

我正在设计分析系统的架构。我有一个在scikit学习中开发的分类集合模型。我想将其移至生产环境,以便使用此模型即时分类新的传入数据。理想情况下,系统应支持将“模型”手动上载到生产系统中。我对分析生产系统没有任何经验。任何建议都会非常有用

我已经检查过Py2PMML但它不支持所有模型。 我主要是寻找Boosted树回归。 PS:我不是要求代码或样品。正确的方向。

1 个答案:

答案 0 :(得分:2)

目前还没有official way将scikit模型导出到PMML。推荐的方法是使用pickle或joblib.dump。请参阅文档的model persistence部分。我们的想法是将模型保存到磁盘:

>>> from sklearn.externals import joblib
>>> joblib.dump(model, 'saved_model.pkl') 

然后将其上传到生产中的服务器并使用以下命令加载:

>>> model = joblib.load('saved_model.pkl')

尝试使用类似环境非常重要,在一个版本的scikit-learn中保存的模型可能无法加载到另一个版本中。