我从Hive下载了数百个文件,它们的架构是一致的。我试图导入一个包含3M节点的文件,使用v2.2的新功能Neo4j-import工具导入它。它'相当快。
这是我的命令
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:\000023_1-hearder.csv,c:\000023_1.csv" --delimiter "TAB"
坚持使用命令,如果我需要导入多个同构模式文件,我应该使用:
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:\1-hearder.csv,c:\1.csv,c:\2.csv,c:\3.csv,c:\4.csv..." --delimiter "TAB"
如果要导入数百或数千个小分区文件,我应该级联文件名怎么办?或者是否有任何错误发生?
答案 0 :(得分:0)
如果文件都具有相同的结构,您可以将它们连接起来。然后将它们压缩,使它们更小。这就是我要做的。
否则,是的文件名为增量编号。
您可以使用带有for循环的powershell / cmd脚本将文件名连接成一个字符串。虽然这可能会导致命令行长度出现问题。