X = np.array(df.drop([label], 1))
X_lately = X[-forecast_out:]
X = X[:-forecast_out]
df.dropna(inplace=True)
y = np.array(df[label])
X_train, X_test, y_train, y_test = cross_validation.train_test_split(X, y, test_size=0.2)
linReg.fit(X_train, y_train)
我已经一次又一次地使用来自不同电子表格的数据来拟合我的线性回归分类器,假设每次我使用新的电子表格使用相同的模型时,它都会添加点并使模型更加健壮。
这个假设是否正确?或者我只是在每次适合时擦拭模型?
如果是这样,我是否有办法让我的模型多次适合这个累积的'类型效应?
答案 0 :(得分:3)
线性回归是一种批量(又称离线)训练方法,您无法通过新模式添加知识。因此,sklearn正在重新拟合整个模型。添加数据的唯一方法是将新模式附加到原始训练X, Y
矩阵并重新拟合。
答案 1 :(得分:0)
你几乎肯定会从头开始擦拭模式。要做你想做的事,你需要将附加数据附加到数据框的底部并使用它重新拟合。