在neo4j v2.2.0-RC01上如何使用Neo4jImport工具导入数百个文件?

时间:2015-03-14 16:13:22

标签: neo4j

我从Hive下载了数百个文件,它们的架构是一致的。我试图导入一个包含3M节点的文件,使用v2.2的新功能Neo4j-import工具导入它。它'相当快。

这是我的命令

Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:\000023_1-hearder.csv,c:\000023_1.csv" --delimiter "TAB"

坚持使用命令,如果我需要导入多个同构模式文件,我应该使用:

Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:\1-hearder.csv,c:\1.csv,c:\2.csv,c:\3.csv,c:\4.csv..." --delimiter "TAB"

如果要导入数百或数千个小分区文件,我应该级联文件名怎么办?或者是否有任何错误发生?

1 个答案:

答案 0 :(得分:0)

如果文件都具有相同的结构,您可以将它们连接起来。然后将它们压缩,使它们更小。这就是我要做的。

否则,是的文件名为增量编号。

您可以使用带有for循环的powershell / cmd脚本将文件名连接成一个字符串。虽然这可能会导致命令行长度出现问题。