如何配置minidom实例以获得unicode编解码器?
在XML文件中处理此代码段:
<title type="text">ME850单片机开发实验仪(增强配置)(产品浏览)-伟纳电子-http://www.willar.com/</title>
产生此错误:
UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-12: ordinal not in range(128)
update:在Python 3中按预期工作;显然这是2.x的已知限制。
答案 0 :(得分:4)
在Python 2.x中,minidom只能解析字节字符串。要么首先解码您的文档(提示:更具体的建议需要您正在运行的代码),要么将其编码为UTF-8。
或者,您可以切换到Python 3.x,其中minidom可以处理字节和字符串。
答案 1 :(得分:0)
你可以使用:
str.encode('utf-8')