序数指示符导致XML解析器出现问题

时间:2017-06-09 10:51:22

标签: python xml xml-parsing minidom

我有一个从网站解析XML的Python脚本,这意味着我无法触及原始XML,它看起来像这样:

<?xml version='1.0' encoding='UTF-8'?>
<list>
    <orderDate>09/06/2017</orderDate>
    <orderObject>RC CAR</orderObject>
    <orderName>2ª versione</orderName>
    <orderShipped>true</orderShipped>
</list>

当服务器用上面的XML数据回答时,我遇到了一个问题,当“orderName”包含一个带有序数指示符的数字时,就像在这种情况下“ª”它给出了以下内容:

xml.parsers.expat.ExpatError: not well-formed (invalid token):

在Python方面,我使用minidom作为解析器使用此代码:

xmldoc = minidom.parse(order_data)

我想指定当另一个XML不包含序数时,一切都很完美。感谢无论谁帮助我。

0 个答案:

没有答案