在Neo4j中加速LOAD CSV的最佳方法

时间:2016-12-19 14:02:53

标签: performance csv neo4j

我正在构建一个Neo4j数据库,我将在其中创建具有数百万个节点的k-ary树。 我目前正在使用此设置:

  1. 从php生成顶点的.csv;
  2. 从php生成边缘的.csv;
  3. 对Neo4j中的顶点运行以下查询:

    使用定期提交50000 LOAD CSV WITH HEADERS FROM' file:///Nodi.csv' AS线 创建(:Vertex {name:line.name, attr1:toFloat(line.attr1),attr2:toFloat(line.attr2),attr3:toFloat(line.attr3),attr4:toFloat(line.attr4),attr5:toFloat(line.attr5)})

  4. 创建索引:顶点(名称)

  5. 对Neo4j中的边缘运行以下查询:

    使用定期提交50000 LOAD CSV with HEADERS FROM' file:///Archi.csv' AS线 匹配(v_from:Vertex {name:line.from}) 匹配(v_to:Vertex {name:line.to})

    创建((v_from)< - [:EDGE {attr1:toFloat(line.attr1),attr2:toFloat(line.attr2),attr3:toFloat(line.attr3),attr4:toFloat(line.attr4) ,attr5:toFloat(line.attr5)}] ​​- (v_to))

  6. 然后创建树。这需要或多或少250秒才能创建2097151节点树。

    我该如何改进? ...我的意思是,可能正在改变"页面缓存大小调整"或者"堆大小" ...有什么我可以用更聪明的方式做的事情吗?或者其他可以改善这个时间的东西......

    感谢您的建议。

0 个答案:

没有答案