在大量位置数据(纬度,经度)中获取最佳项目的最佳方法(或现有算法,库)是什么;说有+ 1M的位置点击,目标是获得最好的100个项目,通常描述整个路径(每个用户查询)
每当有新条目出现时,我正在考虑预先计算“最佳项目”集(基于预定义的时间段);但我不确定
P.S:我正在使用java编程语言,&用于后端存储的mongodb
答案 0 :(得分:0)
您是在问最近的100个地点吗?如果是这样,你已经描述了n-Nearest-Neighbors问题。
最好的办法是构建一个kd-tree,然后执行维基百科文章所描述的搜索。
这有很多实现,例如在scikit-learn
如果你的意思是'最好',我恐怕你需要进一步详细说明。