xml解析问题编码错误

时间:2016-06-11 02:10:43

标签: python xml-parsing python-3.4

我有一个像这样的xml文件

<?xml version="1.0" encoding="UTF-8"?>
<tw>
    <tweet>
        <yazi>atılacak tweet 1</yazi>
        <resim>resim.png</resim>
    </tweet>
    <tweet>
        <yazi>atılacak tweet 2</yazi>
        <resim>yok</resim>
    </tweet>
</tw>

我试图用

阅读它
import xml.etree.ElementTree as ett

e = ett.parse("tweet.xml").getroot()

但是我收到了这个错误,

  

xml.etree.ElementTree.ParseError:XML中指定的编码   声明不正确:第1行,第31栏

为什么呢?我怎么解决这个问题,我搜索了很多,xml文件看起来还不错。我不明白为什么我无法阅读该文件。

2 个答案:

答案 0 :(得分:0)

您的文件中可能包含无效的utf-8字符,例如xml文件是iso-8859-1编码...或者你可以尝试utf-8而不是UTF-8

答案 1 :(得分:-1)

# -*- coding: utf-8 -*-

import xml.etree.ElementTree as ett


e = ett.parse("tweet.xml").getroot()

print(e.tag)

for altindakiler in e:
    print(altindakiler.tag, altindakiler.attrib)