我正在尝试更新我已经受过训练的模型,以便它可以更正所犯的错误。为此,我将使用不正确标签的新数据部分地替换为正确标签的新数据
我已经将贝叶斯模型保存在这样的文件中:
model1 = MultinomialNB() #NaiveBayes model
model1.partial_fit(features_matrix, label_matrix, [0,1,2])
filename = 'trained_NBmodel.pkl' #saving the trained model
joblib.dump(model1, filename)
,然后将另一个文件加载如下:
loaded_model = joblib.load('trained_NBmodel.pkl')
loaded_model.partial_fit(new_features_matrix, new_label_matrix)
filename = 'trained_NBmodel.pkl' #saving the trained model
joblib.dump(loaded_model, filename)
现在它应该使用更新的模型,并且如果给出了new_features_matrix进行预测,则应该以较高的精度预测new_label_matrix,但是模型则不是。它提供与重新安装之前相同的标签矩阵。难道我已经用相似的数据用不同的标签对我的初始模型进行了很多次训练,以致无法从更少的数据中学习?