为KNeighborsClassifier选择n_neighbors

时间:2014-12-05 20:42:36

标签: python scikit-learn

简单的问题我无法在网上找到答案。 根据您的数据,您如何选择用于n_neighbors的号码?或者最好使用默认值5? 我正在使用的数据集使用13个值来预测目标。

1 个答案:

答案 0 :(得分:0)

您应该尝试不同的参数并通过交叉验证进行评估。 Sklearn有一个课程:GridSearchCV

g = GridSearchCV(KNeighborsClassifier(), { "n_neighbors" : [5, 7, 11, 13, 17] })
g.fit(X, y)

可以轻松自定义评分功能,并且(最重要的是)并行运行评估。