示例:我的数据不适合内存:
model=my_model
for i in range(20)
model.fit(X_i,Y_i)
这将删除前19个合身。并保持最后一个。 我怎么能避免这个?我可以重新训练保存和加载的模型吗? 谢谢
答案 0 :(得分:7)
您需要阅读6.1.3。从sklearn文档中增加学习http://scikit-learn.org/stable/modules/scaling_strategies.html
答案 1 :(得分:7)
有些型号有" warm_start"参数,它将使用fit()
中的先前解决方案初始化模型参数例如参见SGDClassifier
答案 2 :(得分:0)
一个选择是首先减少您的数据,或者提取数据的一个子集,或者在数据库的帮助下减少数据的维数。这将大大减少您的数据量。
您可能想根据随机选择的数据子集创建多个模型,然后比较模型,并使用产生最高准确性的最佳模型。