{u'Status': u'OK', u'City': u'Ciri\xe8', u'TimezoneName': '', u'ZipPostalCode': '', u'CountryCode': u'IT', u'Dstoffset': u'0', u'Ip': u'x.x.x.x', u'Longitude': u'7.6', u'CountryName': u'Italy', u'RegionCode': u'12', u'Latitude': u'45.2333', u'Isdst': '', u'Gmtoffset': u'0', u'RegionName': u'Piemonte'}
这是我对象的输出。我想访问City,但它是编码的。如何读取所有参数并对其进行解码
>>> data['City']
u'Ciri\xe8'
>>>data['City'].decode('utf-8')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe8' in position 4: ordinal not in range(128)
我希望明文不是unicode字符串。谢谢!
答案 0 :(得分:9)
你想要的不清楚。如果用'明文'表示删除重音,请尝试:
>>> s = u'Ciri\xe8'
>>> from unicodedata import normalize
>>> normalize('NFKD', s).encode('ASCII', 'ignore')
'Cirie'
答案 1 :(得分:8)
阅读本文:http://nedbatchelder.com/text/unipain.html
然后打印出来:
>>> data = {u'City':u'Ciri\xe8'}
>>> data['City']
u'Ciri\xe8'
>>> print data['City']
Ciriè
如果您不打印它,Python会打印字符串的安全表示,表明它是Unicode文本u''
,并且它包含非ASCII字符\xe8
。 print
尝试通过在终端编码中对Unicode字符串进行编码来显示非ASCII字符。如果字符串包含终端编码不支持的字符,则可能会失败:
>>> print u'\xe8'
è
>>> print u'\x81'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "d:\dev\Python27\lib\encodings\cp437.py", line 12, in encode
return codecs.charmap_encode(input,errors,encoding_map)
UnicodeEncodeError: 'charmap' codec can't encode character u'\x81' in position 0: character maps to <undefined>
在上面的示例中,code page 437支持Unicode字符U + 00E8,但不支持U + 0081。
答案 2 :(得分:0)
通过明文,我想你的意思是ascii。为此,您可以使用:
data['City'].encode('ascii','ignore')
这将删除unicode字符并返回
Ciri
有关详细信息,请参阅此链接:http://docs.python.org/howto/unicode.html