进行索引地理空间查询的最低要求

时间:2018-05-21 06:35:58

标签: apache-spark geomesa

我是地理空间域的新手,我设法将geomesa-spark-jst添加到项目中,这使我能够使用地理空间功能。

我需要经历数百万次地理编码事件(eventRdd)并根据自定义条件查看它们是否与路段线串(roadSegmentRdd)相距一定距离。

目前,对于每个活动,我需要浏览整个roadSegmentRdd,看看这些标准是否已经完美无瑕。

如何使用几何和索引来加快查询速度?最低需要的依赖是什么?

1 个答案:

答案 0 :(得分:1)

通常,您希望至少将您的点数据摄取到GeoMesa数据存储中,然后您可以根据空间谓词进行查询,以有效地过滤到您感兴趣的数据存储。

GeoMesa有几种不同的数据存储选项,从完全分布式数据库(如HBase)到基于文件系统的轻量级解决方案。最好的将取决于您的性能要求和可用的基础架构。有关不同数据存储here和Spark特定详细信息here的更多信息。

一旦您获得了数据,您可以尝试使用其中一种联合方法herehere,具体取决于路段RDD的大小。