我试图将带有希伯来字符的xml转换为json。
这里是xml的一部分:
<Root><City>ירושלים</City></Root>
我尝试了几种方法和编码,但我总是得到这个不可转换的ascii代码而不是希伯来字符:
\ u05e7 \ u05e0 \ u05d9 \ u05d5 \ u05df
这是我的转换脚本:
import xmltodict, json
import sys
infile = open('text.xml','r')
outfile = open('text.json','w')
xmltxt = infile.read().decode('utf_16_le')
decodedXML = xmltodict.parse(xmltxt)
jsontext = json.dumps(decodedXML, encoding='utf_8')
outfile.write(jsontext.encode('utf_8'))
infile.close()
outfile.close()
谢谢
编辑 - 解决方案: 解决方法是添加&#39; ensure_ascii = False&#39;到json.dumps()