我在Mac上使用Docker创建了一个Spark-Neo4j VM,并且能够成功加载http://192.168.99.100:7474/browser。我也能够运行普通查询。 我有一个dataset.csv,我想加载它来创建图形数据库,但我得到“无法加载外部资源:file:/neo4j/community/code/data-3.csv”。我可以在我当地的Neo4j服务器上运行该文件,但是想尝试使用Spark。
如何直接从本地计算机设置路径,或者我可以将数据集传输到docker?
答案 0 :(得分:1)
您可以使用docker cp
command将CSV文件从主机复制到容器文件系统:
docker cp data-3.csv CONTAINER_ID_HERE:/data/data-3.csv
然后使用LOAD CSV
语句中的指定路径:
LOAD CSV FROM "file:///data/data-3.csv" ...
另一种简单的方法是从Google spreadsheeet或Dropbox提供CSV文件,并使用LOAD CSV
声明中的网址。