python编码json与'æøå'

时间:2014-04-13 18:14:12

标签: python json urlopen

我试图从API检索坐标,但其中一个json对象包含丹麦字母,并且我一直收到错误。这就是我所拥有的:

# -*- coding: utf-8 -*-
import urllib2
import json
import codecs

url='http://geo.oiorest.dk/adresser.json?postnr=1577&vejnavn=bernstorffsgade&husnr=16'

addressline = "%s, %s"

try:
    data = urllib2.urlopen(url).read().decode('utf-8')
    adresser = json.loads(data, encoding='utf-8')

    for adresse in adresser:
        print addressline % \
            (adresse['etrs89koordinat']['øst'],
             adresse['etrs89koordinat']['nord'])

except urllib2.HTTPError, e:
    print "HTTP error: %d" % e.code
except urllib2.URLError, e:
    print "Network error: %s" % e.reason.args[1]

我得到的错误:

KeyError: '\xc3\xb8st'

1 个答案:

答案 0 :(得分:3)

您的解码数据包含Unicode字符串,因此您需要使用Unicode字符串查找内容:

print addressline % \
    (adresse[u'etrs89koordinat'][u'øst'],
     adresse[u'etrs89koordinat'][u'nord'])

(您可能会发现它适用于仅包含非重音字符的字符串,无论您是否使用Unicode字符串,因为Unicode和您的默认编码之间会自动转换,但这对重音字符不起作用。)