我正在尝试使用lxml处理GDML文件。
现在,GDML文件可能具有ENTITY声明变量和对应导入文件的引用。例如。:
<!DOCTYPE gdml [
<!ENTITY length "0.5">
]>
和
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE gdml [
<!ENTITY sub2 SYSTEM "boxSolids.gdml">
]>
现在,我已经通过预处理/解析 在传递给lxml之前,带有HTMLParser的HTML会设置变量并嵌入包含文件等内容。但是现在,由于我已经阅读了HTMLParser的文件(似乎需要一个unicode字符串),因此我无法再使用Python3传递给lxml。我收到以下错误:
"Unicode strings with encoding declaration are not supported. Please use bytes input or XML fragments without declaration."