我试图在naive-bayes估计器上进行部分拟合,但在部分拟合之前保留估计量的副本。 sklearn.base.clone只克隆估算器参数,而不是它的数据,所以在这种情况下没用。对克隆执行部分拟合仅使用部分拟合期间添加的数据,因为克隆实际上是空的。
from sklearn.naive_bayes import MultinomialNB
model = MultinomialNB()
fit_model = model.fit(np.array(X),np.array(y))
fit_model2 = model.partial_fit = (np.array(Z),np.array(w)),np.unique(y))
在上面的例子中,fit_model和fit_model2将是相同的,因为它们都指向同一个对象。我想保留原始副本不变。我的解决方法是pickle原始并将其加载到一个新对象,以执行部分适合。像这样:
model = MultinomialNB()
fit_model = model.fit(np.array(X),np.array(y))
import pickle
with open('saved_model', 'wb') as f:
pickle.dump([model], f)
with open('saved_model', 'rb') as f:
[model2] = pickle.load(f)
fit_model2 = model2.partial_fit(np.array(Z),np.array(w)),np.unique(y))
此外,我每次都可以使用新数据完全改装,但由于我需要执行数千次,所以我正在努力寻找更有效的方法。
答案 0 :(得分:4)
model.fit()
返回模型本身(同一个对象)。因此,您不必将其分配给另一个变量,因为它只是别名。
您可以使用deepcopy
以与加载pickle对象相似的方式复制对象。
所以,如果你做了类似的事情:
from copy import deepcopy
model = MultinomialNB()
model.fit(np.array(X), np.array(y))
model2 = deepcopy(model)
model2.partial_fit(np.array(Z),np.array(w)), np.unique(y))
# ...
model2
将是一个独特的对象,复制的参数为model
,包括“训练”参数。
答案 1 :(得分:0)
from copy import deepcopy
model = MultinomialNB()
model.fit(np.array(X), np.array(y))
model2 = deepcopy(model)
weight_vector_model = array(model.coef_[0])
weight_vector_model2 = array(model2.coef_[0])
model2.partial_fit(np.array(Z),np.array(w)), np.unique(y))
weight_vector_model = array(model.coef_[0])
weight_vector_model2 = array(model2.coef_[0])
model and model2 are now completely different objects. partial_fit() on model2 will have no impact on model. The two weight vectors are same after deepcopy but differ after partial_fit() on model2
答案 2 :(得分:0)
我尝试了 deepcopy ,但是删除变量时内存泄漏。我在文档中发现建议改用 clone sklearn.base.clone
from sklearn.base import clone
model2 = clone(model)