Python 2.x minidom:如何设置unicode编解码器?

时间:2012-08-06 19:44:22

标签: python unicode minidom

如何配置minidom实例以获得unicode编解码器?

在XML文件中处理此代码段:

<title type="text">ME850单片机开发实验仪(增强配置)(产品浏览)-伟纳电子-http://www.willar.com/</title>

产生此错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 5-12: ordinal not in range(128)

update:在Python 3中按预期工作;显然这是2.x的已知限制。

2 个答案:

答案 0 :(得分:4)

在Python 2.x中,minidom只能解析字节字符串。要么首先解码您的文档(提示:更具体的建议需要您正在运行的代码),要么将其编码为UTF-8。

或者,您可以切换到Python 3.x,其中minidom可以处理字节和字符串。

答案 1 :(得分:0)

你可以使用:

str.encode('utf-8')