Geospark:是否可以从HDFS输入数据

时间:2016-04-18 10:19:08

标签: apache-spark geospatial

如下面链接所述,Geospark以CSV或制表符分隔格式获取数据。我们可以从HDFS获取数据,将其转换为CSV并将其传递给Geospark进行处理。

我们可以直接在HDFS上使用Geospark并进行处理吗?

https://github.com/DataSystemsLab/GeoSpark

  

GeoSpark支持逗号分隔值(CSV)或制表符分隔   值(TSV)作为输入格式。用户只需要指定输入   格式为Splitter和一个元组中空间信息的起始列   在调用构造函数时为Offset。

1 个答案:

答案 0 :(得分:0)

是。您可以使用GeoSpark来执行此操作。 GeoSpark支持与Apache Spark相同的数据源。在格式方面,GeoSpark支持CSV,TSV,WKT和GeoJSON。