标签: python knn
我有两个数据集(培训和测试),都具有以下3列格式:
纬度,经度,年
我正在尝试从测试集中为测试集中的每个测试样本找到前5名邻居。但是,这里的条件是每个顶级邻居的年份值必须小于测试样本。
如果对于每个测试样本,我都是先根据年份进行训练集选择,然后再进行KNN,则可能会太慢。
我现在正在考虑使用非常大的K值对训练集中的每个测试样本进行KNN查找,首先找到其索引,然后验证其年份小于测试样本的年份。
还有更好的主意或示例代码吗?