使用python(foursquare API)在json文件中解析较低级别?

时间:2013-04-04 20:33:49

标签: python json parsing foursquare

由于我刚刚开始使用python,我不认为我已经掌握了解析json响应的概念,并且在我尝试仅打印出json文件的某些部分时仍然遇到同样的问题。在下面的代码中,我使用foursquare checkins API端点返回我的签入历史记录(为简洁起见,省略了auth流程):

    from rauth import OAuth2Service
    import json
    import pprint

    fs_checkins = session.get(endpoint, params = query_params)
    fs_checkin_data = json.loads(fs_checkins.content)

    pprint.pprint(fs_checkin_data)

这会导致json响应如下:

    {u'response': {u'checkins': {u'count': 74,
                                 u'items': [{u'photos': {u'count': 0,
                                                         u'items': []},
                                             u'posts': {u'count': 0,
                                                        u'textCount': 0},
                                             u'source': {u'name': u'foursquare for iPhone',
                                                         u'url': u'https://foursquare.com/download/#/iphone'},
                                             u'timeZoneOffset': -240,
                                             u'type': u'checkin',
                                             u'venue': {u'beenHere': {u'count': 1,
                                                                      u'marked': False},
                                                        u'canonicalUrl': u'https://foursquare.com/v/nitehawk-cinema/4da491f6593f8eec9a257e35',
                                                        u'categories': [{u'icon': {u'prefix': u'https://foursquare.com/img/categories_v2/arts_entertainment/movietheater_',
                                                                                   u'suffix': u'.png'},
                                                                         u'id': u'4bf58dd8d48988d17f941735',
                                                                         u'name': u'Movie Theater',
                                                                         u'pluralName': u'Movie Theaters',
                                                                         u'primary': True,
                                                                         u'shortName': u'Movie Theater'}],
                                                        u'contact': {u'formattedPhone': u'(718) 384-3980',
                                                                     u'phone': u'7183843980'},
                                                        u'id': u'4da491f6593f8eec9a257e35',
                                                        u'like': False,
                                                        u'likes': {u'count': 114,
                                                                   u'groups': [{u'count': 114,
                                                                                u'items': [],
                                                                                u'type': u'others'}],
                                                                   u'summary': u'114 likes'},
                                                        u'location': {u'address': u'136 Metropolitan Ave.',
                                                                      u'cc': u'US',
                                                                      u'city': u'Brooklyn',
                                                                      u'country': u'United States',
                                                                      u'crossStreet': u'btwn Berry St. & Wythe Ave.',
                                                                      u'lat': 40.716219932353624,
                                                                      u'lng': -73.96228637176877,
                                                                      u'postalCode': u'11211',
                                                                      u'state': u'NY'},
                                                        u'name': u'Nitehawk Cinema',
                                                        u'stats': {u'checkinsCount': 11566,
                                                                   u'tipCount': 99,
                                                                   u'usersCount': 6003},
                                                        u'url': u'http://www.nitehawkcinema.com',
                                                        u'venuePage': {u'id': u'49722288'},
                                                        u'verified': True}}]}}}

我只想解析嵌套在'canonicalUrl'下的'name''venue',并了解结构如下:

    response
       checkins
          items
             venue
                canonicalUrl                 
                name

我尝试循环遍历fs_checkin_data['response']['checkins']以将'items' blob附加到空列表中:

    items = []

    for item in fs_checkin_data['response']['checkins']:
        info = {}
        info['items'] = item['items']
        items.append(info)

认为我可以循环通过那个空列表将'venue' blob附加到另一个空列表中,最后只能打印出'canonicalUrl''name'(因为我不知道实现相同结果的另一种方式,因为我即兴创作的丑陋的黑客共同逻辑道歉)。

但是,上面的代码导致了这个错误:

          info['items'] = item['items']
    TypeError: string indices must be integers

从那时起我不明白

   for item in fs_checkin_data['response']['checkins']: 
       pprint.pprint(item)

json文件的那一部分没有问题。

我知道必须有更好的方法来做到这一点,但我似乎无法找到一个简单,有效的解决方案,所以任何帮助都会非常感激。谢谢。

1 个答案:

答案 0 :(得分:1)

您需要循环items

for item in fs_checkin_data['response']['checkins']['items']:
    venue = item['venue']
    print venue['canonicalUrl'], venue['name']

checkins本身仍然只是一个字典,只有两个键itemscount。循环遍历checkins字典会对密钥进行迭代,因此代码item设置为'count',然后设置为'items'(反之亦然)。另一方面,items是一个字典列表,因此循环遍历该列表可以访问每个单独的项目。