我从openlibrary下载了一个6GB gz
文件,我在我的ubuntu机器上提取了它,它变成了一个40GB txt
文件。使用head
检查文件头时,我找到了这个字符串:
"name": "Mawlu\u0304d Qa\u0304sim Na\u0304yit Bulqa\u0304sim"
这是什么编码?是否有可能获得人类可读的内容或看起来需要再次正确导出数据源?
答案 0 :(得分:1)
它是javascript文字字符串中unicode字符的标准转义。
字符串为Mawlūd Qāsim Nāyit Bulqāsim
答案 1 :(得分:1)
这是普通的JSON编码。您的JSON解析器将\uNNNN
引用转换为Unicode字符。另见:json_encode function: special characters
答案 2 :(得分:0)