标签: apache-spark geomesa
我是地理空间域的新手,我设法将geomesa-spark-jst添加到项目中,这使我能够使用地理空间功能。
geomesa-spark-jst
我需要经历数百万次地理编码事件(eventRdd)并根据自定义条件查看它们是否与路段线串(roadSegmentRdd)相距一定距离。
eventRdd
roadSegmentRdd
目前,对于每个活动,我需要浏览整个roadSegmentRdd,看看这些标准是否已经完美无瑕。
如何使用几何和索引来加快查询速度?最低需要的依赖是什么?
答案 0 :(得分:1)
通常,您希望至少将您的点数据摄取到GeoMesa数据存储中,然后您可以根据空间谓词进行查询,以有效地过滤到您感兴趣的数据存储。
GeoMesa有几种不同的数据存储选项,从完全分布式数据库(如HBase)到基于文件系统的轻量级解决方案。最好的将取决于您的性能要求和可用的基础架构。有关不同数据存储here和Spark特定详细信息here的更多信息。
一旦您获得了数据,您可以尝试使用其中一种联合方法here或here,具体取决于路段RDD的大小。