标签: python xml python-3.x xml-parsing elementtree
我有一个编写(并经过测试)的函数,它将文件中的非ascii字符转换为html数字代码点形式的序数值(希望我说的正确),但etree将coepoints转换回实体时我解析文件。这是我的代码片段:
import xml.etree.ElementTree as ET parse_file = cleanfile.cleanfile(file) root = ET.fromstring(parse_file)
e.g。 &安培; #233;在我的输出文件中变成é。
非常感谢任何帮助!