我正在设计分析系统的架构。我有一个在scikit学习中开发的分类集合模型。我想将其移至生产环境,以便使用此模型即时分类新的传入数据。理想情况下,系统应支持将“模型”手动上载到生产系统中。我对分析生产系统没有任何经验。任何建议都会非常有用
我已经检查过Py2PMML但它不支持所有模型。 我主要是寻找Boosted树回归。 PS:我不是要求代码或样品。正确的方向。
答案 0 :(得分:2)
目前还没有official way将scikit模型导出到PMML。推荐的方法是使用pickle或joblib.dump
。请参阅文档的model persistence部分。我们的想法是将模型保存到磁盘:
>>> from sklearn.externals import joblib
>>> joblib.dump(model, 'saved_model.pkl')
然后将其上传到生产中的服务器并使用以下命令加载:
>>> model = joblib.load('saved_model.pkl')
尝试使用类似环境非常重要,在一个版本的scikit-learn中保存的模型可能无法加载到另一个版本中。