from sklearn.neighbors import KNeighborsClassifier
knn_clf =KNeighborsClassifier()
knn_clf.fit(x_train[:92000],y_train[:92000]) #1st method call
knn_clf.fit(x_train[92000:123000],y_train[92000:123000]) #2nd method call
我的疑问是,当我这样调用fit方法时,第二次调用是否再次从头开始训练模型?还是将其添加到从上一个fit调用(第一个方法调用)中学到的知识?
我要实现的目标是进行批量训练,因为如果我一次使用完整的数据集,笔记本电脑将无法处理数据! 在此先感谢:-)
答案 0 :(得分:0)
每次调用fit方法时,它都会尝试拟合模型。如果多次调用拟合方法,它将尝试重新拟合模型,正如@Julien所指出的那样,批处理训练对KNN没有任何意义。
KNN将考虑所有数据点并选择最靠近的K个邻居。因此,如果您的数据较大,则将花费更多时间。
您所能做的就是缩小数据规模或增加系统内存大小。