我有一个包含几个xml文件路径的列表。我需要打开xml文件,删除一些不需要的数据,然后使用fromstring(lxml)获取xml文件的根目录。对于具有的特定xml文件,lxml解析器将引发错误-'lxml.etree.XMLSyntaxError:无法处理实体属性'
我该如何解决? 我的代码如下所示-
l = ['path1', 'path2', 'path3']
for i in l:
with open_source_file(i) as f:
file_content = f.read()
file_content = remove_utf8_from_xml(file_content)
return etree.fromstring(file_content)