我正在尝试将大型数据集导入到我的本地Neo4j实例中。我试图使用导入工具但到目前为止没有成功。
由于我的数据大小,我不能使用Cypher或“LOAD CSV WITH HEADERS”方法(我的数据也没有标题)。
我正在尝试使用带有以下语句的导入工具:
neo4jimport --into C:\...\my_database --nodes C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB
我的文件是.CSV文件,但值是TAB分隔的。我的头文件格式为:
authorID author_name
我的主要(虚拟示例)文件如下所示:
1 Banana
2 Apple
3 Pear
4 Potato
5 Tomato
我用逗号和分号尝试了虚拟文件,方法工作正常但是使用TAB这两个属性都加入了一个,所以导入后我只有一个名为的属性:
authorID author_name
由于我的文件大小,我不能用逗号替换TABS。我尝试将分隔符更改为'\ t'和其他组合,但没有去。
此外,我想知道是否可以在创建时为每个节点添加静态标签,即使未从数据文件中读取标签。
我正在考虑使用不同的方法,使用Python和py2neo,如果导入工具没有拉它。
我在普通的便携式机器上使用Neo4j 2.2.3社区版。
非常感谢任何帮助。
答案 0 :(得分:3)
你有一个拼写错误:它不是delimeter
而是delimiter
,请参阅neo4jimport --help
更新到2.2.5以获得性能最高的最新版本。
你的标题应该是:
authorID:ID author_name
您还应提供--id-type integer
您可以在命令行上为所有节点提供标签:--nodes:Author