当属性名称是唯一的时,neo4j批量导入将进行爬网

时间:2014-11-15 13:45:13

标签: neo4j

我使用batch_import实用程序在neo4j中导入了50万个节点,每个节点有两个属性。

每个节点代表一个url,其中一个属性是url的哈希值。

装载非常慢。肯定需要3个多小时。

我尝试使用generate.sh加载类似的图表,并在几秒钟内加载。

我的问题是:是否将url hash作为影响导入的属性?

2 个答案:

答案 0 :(得分:1)

解决了......我有一个“在网址中,CSVParser被困在那... 逃脱它,事情在18秒内创造......: - )

答案 1 :(得分:1)

很高兴你解决了它。我们一直在玩csvstat来尝试使用杂散引号来识别这类问题。