xml.parsers.expat.ExpatError:无效字符编号的引用

时间:2019-07-17 10:40:18

标签: encoding xml-parsing ascii xmltodict

我对解析XML的经验并不丰富,得到

xml.parsers.expat.ExpatError: reference to invalid character number

当尝试分析包含以下内容作为标记值的大型XML文件

<notes>Level transpassing&#x1E;: 
FL060 and more
</notes>

我发现此字符位于Ascii Key Codes

我的代码看起来像

with open(file) as fd:
    doc = xmltodict.parse(fd.read())
    output_dict = json.loads(json.dumps(doc))

我的文件的头是<?xml version="1.0" encoding="utf-8"?>,所以我的数据(大部分是)以UTF-8编码的。

我正在尝试this,但没有成功。我哪里错了?解析它的方式是什么?

更新Here是逃避案件的方式...我想找到合适的人

0 个答案:

没有答案