Python XML解析垃圾错误 - 多个编码行

时间:2017-08-19 03:12:20

标签: python xml element

当我尝试解析XML文件时,我收到了垃圾错误。它是一个包含100个合并XML文件的文件,产生了100个标签。也意味着它不包含任何正确的根元素。所以我有两个问题,我如何读取文件,以免它出错?我如何解决没有根元素的问题?

我一直想尝试使用它一段时间但无济于事,我已经尝试逐行阅读并转换为列表但我不知道该怎么做做它....

谢谢

1 个答案:

答案 0 :(得分:0)

  

问题:如何阅读文件以免出错?

阅读时使用try: ... except:块,例如:

try:
    element = root.next_element()
except Exception as exp:
    print(exp)
  

问题:如何修复无根元素的问题?

添加一个<root>标记,其中包含给定的XML表或部分:

xml = '<root>{}</root>'.format(xml)