由于我刚刚开始使用python,我不认为我已经掌握了解析json响应的概念,并且在我尝试仅打印出json文件的某些部分时仍然遇到同样的问题。在下面的代码中,我使用foursquare checkins API端点返回我的签入历史记录(为简洁起见,省略了auth流程):
from rauth import OAuth2Service
import json
import pprint
fs_checkins = session.get(endpoint, params = query_params)
fs_checkin_data = json.loads(fs_checkins.content)
pprint.pprint(fs_checkin_data)
这会导致json响应如下:
{u'response': {u'checkins': {u'count': 74,
u'items': [{u'photos': {u'count': 0,
u'items': []},
u'posts': {u'count': 0,
u'textCount': 0},
u'source': {u'name': u'foursquare for iPhone',
u'url': u'https://foursquare.com/download/#/iphone'},
u'timeZoneOffset': -240,
u'type': u'checkin',
u'venue': {u'beenHere': {u'count': 1,
u'marked': False},
u'canonicalUrl': u'https://foursquare.com/v/nitehawk-cinema/4da491f6593f8eec9a257e35',
u'categories': [{u'icon': {u'prefix': u'https://foursquare.com/img/categories_v2/arts_entertainment/movietheater_',
u'suffix': u'.png'},
u'id': u'4bf58dd8d48988d17f941735',
u'name': u'Movie Theater',
u'pluralName': u'Movie Theaters',
u'primary': True,
u'shortName': u'Movie Theater'}],
u'contact': {u'formattedPhone': u'(718) 384-3980',
u'phone': u'7183843980'},
u'id': u'4da491f6593f8eec9a257e35',
u'like': False,
u'likes': {u'count': 114,
u'groups': [{u'count': 114,
u'items': [],
u'type': u'others'}],
u'summary': u'114 likes'},
u'location': {u'address': u'136 Metropolitan Ave.',
u'cc': u'US',
u'city': u'Brooklyn',
u'country': u'United States',
u'crossStreet': u'btwn Berry St. & Wythe Ave.',
u'lat': 40.716219932353624,
u'lng': -73.96228637176877,
u'postalCode': u'11211',
u'state': u'NY'},
u'name': u'Nitehawk Cinema',
u'stats': {u'checkinsCount': 11566,
u'tipCount': 99,
u'usersCount': 6003},
u'url': u'http://www.nitehawkcinema.com',
u'venuePage': {u'id': u'49722288'},
u'verified': True}}]}}}
我只想解析嵌套在'canonicalUrl'
下的'name'
和'venue'
,并了解结构如下:
response
checkins
items
venue
canonicalUrl
name
我尝试循环遍历fs_checkin_data['response']['checkins']
以将'items'
blob附加到空列表中:
items = []
for item in fs_checkin_data['response']['checkins']:
info = {}
info['items'] = item['items']
items.append(info)
认为我可以循环通过那个空列表将'venue'
blob附加到另一个空列表中,最后只能打印出'canonicalUrl'
和'name'
(因为我不知道实现相同结果的另一种方式,因为我即兴创作的丑陋的黑客共同逻辑道歉)。
但是,上面的代码导致了这个错误:
info['items'] = item['items']
TypeError: string indices must be integers
从那时起我不明白
for item in fs_checkin_data['response']['checkins']:
pprint.pprint(item)
json文件的那一部分没有问题。
我知道必须有更好的方法来做到这一点,但我似乎无法找到一个简单,有效的解决方案,所以任何帮助都会非常感激。谢谢。
答案 0 :(得分:1)
您需要循环items
:
for item in fs_checkin_data['response']['checkins']['items']:
venue = item['venue']
print venue['canonicalUrl'], venue['name']
checkins
本身仍然只是一个字典,只有两个键items
和count
。循环遍历checkins
字典会对密钥进行迭代,因此代码item
设置为'count'
,然后设置为'items'
(反之亦然)。另一方面,items
是一个字典列表,因此循环遍历该列表可以访问每个单独的项目。