我正在处理一个数据项目,该项目要求我将执行后的结果与不同的k值进行比较。我的数据集包含33887个样本和2304个特征。为此,我只是比较不同k值实验之间的准确度百分比。由于某些奇怪的原因,百分比似乎都相对相同。
这是我的配置以及用来获取预测以供以后计算精度的功能:
knc = KNeighborsClassifier(algorithm='ball_tree', n_neighbors=3, weights='distance')
knc.fit(features, classes)
pred_list = knc.predict(test_features)
然后我将执行相同的操作,但先与5个邻居,再与7个邻居。 无论k的值如何,我的准确度(使用我的特定数据集)始终约为40%。我在做错什么吗?