出口机器学习模型

时间:2016-06-24 20:51:19

标签: python python-2.7 machine-learning scikit-learn

我正在创建机器学习算法并想要导出它。 假设我使用scikit学习库和随机森林算法。

 modelC=RandomForestClassifier(n_estimators=30)
 m=modelC.fit(trainvec,yvec)
  

modelC.model

我如何导出它或是否有任何功能?

1 个答案:

答案 0 :(得分:4)

如果你关注模型持久性的documentation

In [1]: from sklearn.ensemble import RandomForestClassifier
In [2]: from sklearn import datasets
In [3]: from sklearn.externals import joblib
In [4]: iris = datasets.load_iris()
In [5]: X, y = iris.data, iris.target
In [6]: m = RandomForestClassifier(2).fit(X, y)
In [7]: m
Out[7]: 
RandomForestClassifier(bootstrap=True, class_weight=None, criterion='gini',
            max_depth=None, max_features='auto', max_leaf_nodes=None,
            min_samples_leaf=1, min_samples_split=2,
            min_weight_fraction_leaf=0.0, n_estimators=2, n_jobs=1,
            oob_score=False, random_state=None, verbose=0,
            warm_start=False)
In [8]: joblib.dump(m, "filename.cls")

事实上,您可以使用pickle.dump代替joblib,但joblib可以很好地压缩分类器中的numpy数组。