JSON文件中有哪些字符编码?

时间:2014-12-12 15:53:12

标签: json

我从openlibrary下载了一个6GB gz文件,我在我的ubuntu机器上提取了它,它变成了一个40GB txt文件。使用head检查文件头时,我找到了这个字符串:

"name": "Mawlu\u0304d Qa\u0304sim Na\u0304yit Bulqa\u0304sim"

这是什么编码?是否有可能获得人类可读的内容或看起来需要再次正确导出数据源?

3 个答案:

答案 0 :(得分:1)

它是javascript文字字符串中unicode字符的标准转义。

字符串为Mawlūd Qāsim Nāyit Bulqāsim

答案 1 :(得分:1)

这是普通的JSON编码。您的JSON解析器将\uNNNN引用转换为Unicode字符。另见:json_encode function: special characters

答案 2 :(得分:0)

看起来像unicode

http://www.charbase.com/0304-unicode-combining-macron

U + 0304:组合MACRON