如何阻止etree将数字html代码点转换为非ascii字符?

时间:2014-06-09 21:24:14

标签: python xml python-3.x xml-parsing elementtree

我有一个编写(并经过测试)的函数,它将文件中的非ascii字符转换为html数字代码点形式的序数值(希望我说的正确),但etree将coepoints转换回实体时我解析文件。这是我的代码片段:

import xml.etree.ElementTree as ET

parse_file = cleanfile.cleanfile(file)
root = ET.fromstring(parse_file)

e.g。 &安培; #233;在我的输出文件中变成é。

非常感谢任何帮助!

0 个答案:

没有答案