我试图解析an xml document,当我尝试运行我的代码时,它有许多导致ParseError的未定义实体,如下所示:
import xml.etree.ElementTree as ET
tree = ET.parse('cic.fam_lat.xml')
root = tree.getroot()
while True:
try:
for name in root.iter('name'):
print(root.tag, name.text)
except xml.etree.ElementTree.ParseError:
pass
for name in root.iter('name'):
print(name.text)
所述错误的一个例子如下,并且有许多未定义的实体都将抛出相同的错误:
我只是想忽略它们而不是进入并编辑每一个。我应该如何编辑我的异常处理以捕获这些错误实例? (即,我做错了什么?)
答案 0 :(得分:1)
有一些解决方法,比如定义自定义实体,建议在:
但是,如果您能够切换到lxml
,则其XMLParser()
可以在“恢复”模式中工作,这将“忽略”未定义的实体:
import lxml.etree as ET
parser = ET.XMLParser(recover=True)
tree = ET.parse('cic.fam_lat.xml', parser=parser)
for name in root.iter('name'):
print(root.tag, name.text)
(为我工作 - 打印了标签名称和文字)