我正在使用Python 2.7为Windows编写一个简单的程序。它打开一封电子邮件,从中获取一些文字并将它们放在网上的表格中。当电子邮件包含Ó,Ź,Ł等抛光字母时出现问题。每当我尝试打印它时,我会得到类似的东西:['\ xc4 \ x84','\ xc5 \ xbb','\ xc3 \ x93',' \ xc4 \ x86','\ xc5 \ xb9']。 我已经知道这是因为编码而且Python 3没有这样的问题。这是我已经尝试过的:
mail = " Ą Ż Ó Ć Ź"
mail = mail.split()
mail = mail.decode("UTF-8")
print mail
或
mail = " Ą Ż Ó Ć Ź"
mail = mail.split()
[x.encode('UTF8') for x in mail]
print mail
有人可以告诉我如何正确打印清单吗?
答案 0 :(得分:0)
Python 2.x使用ASCII作为默认编码。要强制它使用Unicode,请将此行添加到程序的顶部。
# -*- coding: utf-8 -*-
此外,您应该在任何字符串文字前加上“u”。 e.g。
polishLetters = u'Ą Ż Ó Ć Ź'