我正在使用导入选项将大约46K节点的大数据集导入Neo4j。现在这个数据集是动态的,即新条目不断添加到它,所以如果我必须重新执行整个导入,那么它的资源浪费。我尝试使用python的neo4j rest客户端发送查询来创建新的数据点,但随着新数据点数量的增加,所需的时间超过46k节点的导入。所以有任何替代方法可以添加这些数据点或我是否必须重做整个导入?
答案 0 :(得分:1)
首先 - 46k相当小。
将数据导入Neo4j的最简单方法是使用LOAD CSV
与PERIODIC COMMIT
进行联合。 http://neo4j.com/developer/guide-import-csv/包含所有详细信息。
确保有适当的索引来快速找到需要通过增量更新来更改的内容。