这是我的问题,我有一个巨大的火车集,所以我无法将其加载到内存中并应用此代码。
model = LogisticRegression()
model = model.fit(train_set_df, y_label_df)
所以,我正在寻找一种方法来训练我的Sklearn.LogisticRegression模型,方法是逐个传递实例,以避免将所有列车数据加载到内存中。感谢
答案 0 :(得分:1)
您正在寻找partial_fit
方法。 LogisticRegression
不支持它。您可以使用MultinomialNB
(或任何其他朴素贝叶斯)或SGDClassifier
代替。