如下面链接所述,Geospark以CSV或制表符分隔格式获取数据。我们可以从HDFS获取数据,将其转换为CSV并将其传递给Geospark进行处理。
我们可以直接在HDFS上使用Geospark并进行处理吗?
https://github.com/DataSystemsLab/GeoSpark
GeoSpark支持逗号分隔值(CSV)或制表符分隔 值(TSV)作为输入格式。用户只需要指定输入 格式为Splitter和一个元组中空间信息的起始列 在调用构造函数时为Offset。
答案 0 :(得分:0)
是。您可以使用GeoSpark来执行此操作。 GeoSpark支持与Apache Spark相同的数据源。在格式方面,GeoSpark支持CSV,TSV,WKT和GeoJSON。