我不知道发生了什么,但我正在阅读文件并使用SAX处理XML。一个'''字符导致异常,因此我尝试使用decode / encode。
问题在于我能做到这一点:
>>> line = '€'
>>> line
'€'
现在它的工作原理如下:
>>> line = '€'
>>> line
'\xe2\x82\xac'
这适用于所有特殊字符,例如:á,é,í等。
我该如何解决?
答案 0 :(得分:1)
使用unicode类型:
>>> line = u'€'
>>> print(line)
€
在处理字符集时,了解要解码的编解码器和编码是非常重要的。
供参考,我使用的是Python 2.7.8。