如何从本地计算机(mac)加载csv到Spark-Neo4j docker?

时间:2015-12-15 18:49:03

标签: neo4j apache-spark docker

我在Mac上使用Docker创建了一个Spark-Neo4j VM,并且能够成功加载http://192.168.99.100:7474/browser。我也能够运行普通查询。 我有一个dataset.csv,我想加载它来创建图形数据库,但我得到“无法加载外部资源:file:/neo4j/community/code/data-3.csv”。我可以在我当地的Neo4j服务器上运行该文件,但是想尝试使用Spark。

如何直接从本地计算机设置路径,或者我可以将数据集传输到docker?

1 个答案:

答案 0 :(得分:1)

您可以使用docker cp command将CSV文件从主机复制到容器文件系统:

docker cp data-3.csv CONTAINER_ID_HERE:/data/data-3.csv

然后使用LOAD CSV语句中的指定路径:

LOAD CSV FROM "file:///data/data-3.csv" ...

另一种简单的方法是从Google spreadsheeet或Dropbox提供CSV文件,并使用LOAD CSV声明中的网址。