xml.etree.ElementTree.ParseError - 异常处理没有捕获错误

时间:2017-12-21 04:05:29

标签: python xml elementtree

我试图解析an xml document,当我尝试运行我的代码时,它有许多导致ParseError的未定义实体,如下所示:

import xml.etree.ElementTree as ET

tree = ET.parse('cic.fam_lat.xml')
root = tree.getroot()

while True:
    try:
        for name in root.iter('name'):
            print(root.tag, name.text)
    except xml.etree.ElementTree.ParseError:
        pass

for name in root.iter('name'):
    print(name.text)

所述错误的一个例子如下,并且有许多未定义的实体都将抛出相同的错误: error description

我只是想忽略它们而不是进入并编辑每一个。我应该如何编辑我的异常处理以捕获这些错误实例? (即,我做错了什么?)

1 个答案:

答案 0 :(得分:1)

有一些解决方法,比如定义自定义实体,建议在:

但是,如果您能够切换到lxml,则其XMLParser()可以在“恢复”模式中工作,这将“忽略”未定义的实体:

import lxml.etree as ET

parser = ET.XMLParser(recover=True)
tree = ET.parse('cic.fam_lat.xml', parser=parser)

for name in root.iter('name'):
    print(root.tag, name.text)

(为我工作 - 打印了标签名称和文字)