Sklearn中的fit方法。使用KNeighborsClassifier时

时间:2018-09-03 07:04:35

标签: python machine-learning scikit-learn knn

from sklearn.neighbors import KNeighborsClassifier

knn_clf =KNeighborsClassifier() 
knn_clf.fit(x_train[:92000],y_train[:92000]) #1st method call
knn_clf.fit(x_train[92000:123000],y_train[92000:123000]) #2nd method call

我的疑问是,当我这样调用fit方法时,第二次调用是否再次从头开始训练模型?还是将其添加到从上一个fit调用(第一个方法调用)中学到的知识?

我要实现的目标是进行批量训练,因为如果我一次使用完整的数据集,笔记本电脑将无法处理数据! 在此先感谢:-)

1 个答案:

答案 0 :(得分:0)

每次调用fit方法时,它都会尝试拟合模型。如果多次调用拟合方法,它将尝试重新拟合模型,正如@Julien所指出的那样,批处理训练对KNN没有任何意义。

KNN将考虑所有数据点并选择最靠近的K个邻居。因此,如果您的数据较大,则将花费更多时间。

您所能做的就是缩小数据规模或增加系统内存大小。