我有一个KNearestNeighbor分类器,我试图使其适合我的数据。
我尝试了100、1000和10000个数据条目,但得到了一些不同的结果。
通过1000个条目,我得到了下面的代码图
error_rate = []
for i in range(1,40):
knn = KNeighborsClassifier(n_neighbors=i)
...
plt.figure(figsize=(10, 6))
plt.plot(error_rate, color='blue', linestyle='dashed', marker='o',
markerfacecolor='red', markersize=10)
plt.title('Error Rate vs. K Value')
plt.xlabel('K')
plt.ylabel('Error Rate')
与其他一些数据条目不同,该条目具有相当大的error_rate
当我打印结果时
print(classification_report(y_test, pred))
print(confusion_matrix(y_test, pred))
结果相当不错
无论分类报告和混淆矩阵中的K值如何,我的结果几乎相同