我对解析XML的经验并不丰富,得到
xml.parsers.expat.ExpatError: reference to invalid character number
当尝试分析包含以下内容作为标记值的大型XML文件
<notes>Level transpassing:
FL060 and more
</notes>
我发现此字符位于Ascii Key Codes
我的代码看起来像
with open(file) as fd:
doc = xmltodict.parse(fd.read())
output_dict = json.loads(json.dumps(doc))
我的文件的头是<?xml version="1.0" encoding="utf-8"?>
,所以我的数据(大部分是)以UTF-8编码的。
我正在尝试this,但没有成功。我哪里错了?解析它的方式是什么?
更新: Here是逃避案件的方式...我想找到合适的人