使用导入工具

时间:2015-09-20 19:27:23

标签: neo4j graph-databases py2neo tsv data-import

我正在尝试将大型数据集导入到我的本地Neo4j实例中。我试图使用导入工具但到目前为止没有成功。

由于我的数据大小,我不能使用Cypher或“LOAD CSV WITH HEADERS”方法(我的数据也没有标题)。

我正在尝试使用带有以下语句的导入工具:

neo4jimport --into C:\...\my_database --nodes    C:\...\Authors_header.csv,C:\...\Authors.csv --stacktrace --delimeter TAB

我的文件是.CSV文件,但值是TAB分隔的。我的头文件格式为:

authorID    author_name

我的主要(虚拟示例)文件如下所示:

1   Banana
2   Apple   
3   Pear
4   Potato
5   Tomato 

我用逗号和分号尝试了虚拟文件,方法工作正常但是使用TAB这两个属性都加入了一个,所以导入后我只有一个名为的属性:

authorID author_name 

由于我的文件大小,我不能用逗号替换TABS。我尝试将分隔符更改为'\ t'和其他组合,但没有去。

此外,我想知道是否可以在创建时为每个节点添加静态标签,即使未从数据文件中读取标签。

我正在考虑使用不同的方法,使用Python和py2neo,如果导入工具没有拉它。

我在普通的便携式机器上使用Neo4j 2.2.3社区版。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:3)

你有一个拼写错误:它不是delimeter而是delimiter,请参阅neo4jimport --help

更新到2.2.5以获得性能最高的最新版本。

你的标题应该是:

authorID:ID author_name

您还应提供--id-type integer

您可以在命令行上为所有节点提供标签:--nodes:Author