加载已经过训练的SGDC模型并尝试再次使用新功能集和数据进行partial_fit。 但是收到了ValueError:类应该包含所有可以在y中的有效标签 和我的class_weights =无,并希望每个班级都有相同的权重。
model_predicted_networktype = joblib.load(f)
new_training_data_count_matrix
=count_vect_predicted_networktype.transform(training_dataset)
new_training_tf_idf = tf_idf(new_training_data_count_matrix)
model_predicted_networktype.partial_fit(new_training_tf_idf,training_labels)
我遇到了问题,我是否已经为我已经训练过的模型添加了新功能,这些功能与以前的功能有所不同,但是我需要为已经部署的数据添加新功能吗?
答案 0 :(得分:0)
在您第一次调用partial_fit时,请执行classes = numpy.arange(some_estimated_max_number)并将数字映射到实际标签。这样您就可以动态添加数据。