使用头文件时批量导入CSV

时间:2016-11-22 06:11:45

标签: neo4j

希望有人可以帮我使用neo4j-import。我正在尝试按照http://neo4j.com/docs/operations-manual/current/tutorial/import-tool/上的教程,使用单独的头文件。我希望有人可以帮助我认为是一个简单的错误。

如果我尝试从包含标题行的CSV导入,则可以正常工作。

head patents.csv

hanID:ID|Appln|Publn_auth|Patent_number
1832552|1|EP|EP1037159

$NB/neo4j-import --into test.db --nodes "patents2.csv" --delimiter "|" --skip-duplicate-nodes

如果我尝试在单独的文件中使用标题行,它似乎运行正常,但它会创建0个节点。

cat header.csv

hanID:ID|Appln|Publn_auth|Patent_number

head -n 1 patents.csv

1832552|1|EP|EP1037159

$NB/neo4j-import --into test.db --nodes "header.csv, patents.csv" --delimiter "|" --skip-duplicate-nodes

我觉得我正在完全按照教程,所以我真的很困惑。

非常感谢任何帮助。谢谢。

1 个答案:

答案 0 :(得分:1)

删除文件列表中逗号后面的空格:

$NB/neo4j-import --into test.db --nodes "header.csv,patents.csv" --delimiter "|" --skip-duplicate-nodes

而不是

$NB/neo4j-import --into test.db --nodes "header.csv, patents.csv" --delimiter "|" --skip-duplicate-nodes

请注意,输出确实告诉您它只导入标题:

Neo4j version: 3.0.7
Importing the contents of these files into test.db:
Nodes:
  /path/to/header.csv

Available resources:
...

使用固定命令行:

Neo4j version: 3.0.7
Importing the contents of these files into test.db:
Nodes:
  /path/to/header.csv
  /path/to/patents.csv

Available resources:
...

是的,neo4j-import有时可能有点过于严格和字面意思。你可以打开一个enhancement request,这样就可以更轻松并修剪空白。