在浏览器中使用LOAD CSV时,如何使Cypher尊重字符编码?

时间:2015-12-06 09:18:12

标签: character-encoding neo4j load-csv

我的案例:丹麦学生名单(名字包括ü,æ,ø,å等字符)。最小工作示例 CSV文件:

Fornavn;Efternavn;Mobil;Adresse
Øjvind;Ørnenæb;87654321;Paradisæblevej 125, 5610 Åkirkeby
Süzette;Ågård;12345678;Ærøvej 123, 2000 Frederiksberg

浏览器中的neo4j-editor:

$ LOAD CSV WITH HEADERS  FROM 'file:///path/to/file.csv' AS line FIELDTERMINATOR ";"
CREATE (:Elev {fornavn: line.Fornavn, efternavn: line.Efternavn, mobil: line.Mobilnr, adresse: line.Adresse})

导致注册如下: Neo4j browser screenshot,包含?字符,需要丹麦语/德语字符。我的数据来自学习管理系统到Excel。从Excel导出为CSV时,我可以控制文件编码作为“另存为”对话框的功能。我已经尝试将Excel编码为“UTF-8”(它需要the Neo4j manual says),“ISO-Western European”,“Windows-Western European”,“Unicode”在单独命名的文件中,并调整{{相应的1}}条款。

有趣的是,完全相同的虚假陈述结果,独立于哪个(明显?)文件编码,我在“另存为”时从Excel请求。将名称和地址直接复制粘贴到编辑器中时,我不会遇到同样的问题。

1 个答案:

答案 0 :(得分:1)

检查Michael Hunger's blog post here,其中包含一些提示,即:

  

如果你使用非ascii字符(变音符号,重音等),请确保使用适当的语言环境或提供系统属性-Dfile.encoding=UTF8