批量插入neo4j - 最佳选择?

时间:2014-06-10 13:23:38

标签: python neo4j batch-processing batch-insert

我一直在尝试将相对较大的数据集导入neo4j ...大约有5000万个关系节点。

我首先通过py2neo实验Cypher - >哪个确实有效,但如果你需要使用CREATE UNIQUE或MERGE,它会变得很慢。

我现在正在研究其他批量导入方法,我想知道是否有关于哪些方法最适合一般工作流程和速度的建议:

  • Neo4j文档提到了batch insertion facility似乎是Java并且是Neo4j发行版的一部分;
  • Michael Hunger在github上还有batch inserter,我不确定这与发行版中包含的内容有多么相似或不同;
  • 然后还有load2neo,我正在测试;
  • 然后有load from CSV功能作为Neo v2的CYPHER的一部分,虽然我不确定它是否主要是一个便利因素,如果它的性能类似于只是批量执行Cypher查询,比方说,通过Cypher交易获得40 000美元。

我非常感谢对这些选项之间的功能,工作流程和速度差异的任何评论。

1 个答案:

答案 0 :(得分:1)

如果您可以使用最新版本的Neo4j,建议的方法是在Cypher中使用新的LOAD CSV语句:http://docs.neo4j.org/chunked/stable/cypherdoc-importing-csv-files-with-cypher.html