我想应用针对大型数据集实现的修改后的KNN。我试图找到一个大型数据集(超过2万行),该数据集非常适合KNN,以便可以将经典KNN与我自己的版本进行比较。有例子吗?
答案 0 :(得分:1)
如果通过互联网正确搜索,肯定会有很多。 MNIST手写数字数据集可能是一个很好的起点,并且有70000个带标签的示例。精心调整的KNN在此数据上效果很好。
它可以从sklearn库中下载。
>>> from sklearn.datasets import fetch_mldata
>>> mnist = fetch_mldata('MNIST original', data_home=custom_data_home)
有关更多详细信息,请参阅https://scikit-learn.org/0.19/datasets/mldata.html。