在Python中覆盖xml阅读器的编码

时间:2016-04-05 18:31:59

标签: python xml encoding

我正在使用以下代码将xml文件读入Python:

import xml.etree.ElementTree as ET
tree = ET.parse(file_name)

由于某些原因,我正在读取的源似乎在文件中指定了不正确的编码(对于我正在读取的数据的10年是正确的,然后突然我的后续文件出现问题)。< / p>

特别是我收到了以下错误:

xml.etree.ElementTree.ParseError: encoding specified in XML declaration is incorrect: line 1, column 30

我认为数据是UTF-8中的编码,但文件中指定的编码是UTF-16 [文件的第一行是<?xml version='1.0' encoding='UTF-16'?>] - 当我手动更改文件时文字说UTF-8我没有提出错误,据我所知,它似乎正在正确阅读所有内容。

如何覆盖xml阅读器,以便将编码视为UTF-8,并忽略文件中指定的内容?

0 个答案:

没有答案