我正在使用以下代码将xml文件读入Python:
import xml.etree.ElementTree as ET
tree = ET.parse(file_name)
由于某些原因,我正在读取的源似乎在文件中指定了不正确的编码(对于我正在读取的数据的10年是正确的,然后突然我的后续文件出现问题)。< / p>
特别是我收到了以下错误:
xml.etree.ElementTree.ParseError: encoding specified in XML declaration is incorrect: line 1, column 30
我认为数据是UTF-8
中的编码,但文件中指定的编码是UTF-16
[文件的第一行是<?xml version='1.0' encoding='UTF-16'?>
] - 当我手动更改文件时文字说UTF-8
我没有提出错误,据我所知,它似乎正在正确阅读所有内容。
如何覆盖xml阅读器,以便将编码视为UTF-8
,并忽略文件中指定的内容?