我正在尝试使用http://scikit-learn.org/stable/modules/model_persistence.html中描述的joblib在Sci-Kit Learn中实现模型持久性。但是当我重新加载模型时,我发现模型coef_矩阵的所有行都被设置为零,除了第一行。
joblib.dump(RidgeTfIDF,'/Users/gireesh/Documents/NBC_Chris/modeling/Pickled Models/RidgeESTfIDF11_02_2015_30.pkl')
R2 = joblib.load('/Users/gireesh/Documents/NBC_Chris/modeling/Pickled Models/RidgeESTfIDF11_02_2015_30.pkl')
R2.coef_[1].nonzero()
给出:
Out[95]: (array([], dtype=int64),)
虽然 RidgeTfIDF.coef_ [1] .nonzero()
给出
Out[96]: (array([ 0, 1, 6, ..., 1048563, 1048565, 1048569]),)
当我使用np.save将RidgeTfIDF.coef_的每一行保存在一个单独的文件中,然后从这些文件重新加载时,该模型工作正常。然而,这要慢得多,我想修复joblib问题。