我有一堆来自Facebook帖子的JSON数据,如下所示:
{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}
JSON数据是半结构化的,并且都不相同。 以下是我的代码:
import json
str = '{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}'
data = json.loads(str)
post_id = data['id']
post_type = data['type']
print(post_id)
print(post_type)
created_time = data['created_time']
updated_time = data['updated_time']
print(created_time)
print(updated_time)
if data.get('application'):
app_id = data['application'].get('id', 0)
print(app_id)
else:
print('null')
#if data.get('to'):
#... This is the part I am not sure how to do
# Since it is in the form "to": {"data":[{"id":...}]}
我希望代码打印 to_id 为1543,否则打印'null'
我不知道该怎么做。
谢谢!
答案 0 :(得分:116)
import json
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}]}, "type": "status", "id": "id_7"}"""
def getTargetIds(jsonData):
data = json.loads(jsonData)
if 'to' not in data:
raise ValueError("No target in given data")
if 'data' not in data['to']:
raise ValueError("No data for target")
for dest in data['to']['data']:
if 'id' not in dest:
continue
targetId = dest['id']
print("to_id:", targetId)
输出:
In [9]: getTargetIds(s)
to_id: 1543
答案 1 :(得分:65)
如果你想要的只是检查密钥是否存在
h = {'a': 1}
'b' in h # returns False
如果要检查密钥是否有值
h.get('b') # returns None
如果缺少实际值,则返回默认值
h.get('b', 'Default value')
答案 2 :(得分:12)
为这样的事情创建辅助实用程序方法是一个很好的做法,这样无论何时需要更改属性验证的逻辑,它都会在一个地方,并且代码对于关注者来说更具可读性。
例如,在JsonUtils
中创建一个辅助方法(或使用静态方法的类json_utils.py
):
def get_attribute(data, attribute, default_value):
return data.get(attribute) or default_value
然后在您的项目中使用它:
from json_utils import get_attribute
def my_cool_iteration_func(data):
data_to = get_attribute(data, 'to', None)
if not data_to:
return
data_to_data = get_attribute(data_to, 'data', [])
for item in data_to_data:
print('The id is: %s' % get_attribute(item, 'id', 'null'))
重要提示:
我之所以使用data.get(attribute) or default_value
而不仅仅是data.get(attribute, default_value)
:
{'my_key': None}.get('my_key', 'nothing') # returns None
{'my_key': None}.get('my_key') or 'nothing' # returns 'nothing'
在我的应用程序中获取具有值的属性' null'与完全没有获得属性是一样的。如果您的使用情况不同,则需要更改此内容。
答案 3 :(得分:5)
jsonData = """{"from": {"id": "8", "name": "Mary Pinter"}, "message": "How ARE you?", "comments": {"count": 0}, "updated_time": "2012-05-01", "created_time": "2012-05-01", "to": {"data": [{"id": "1543", "name": "Honey Pinter"}, {"name": "Joe Schmoe"}]}, "type": "status", "id": "id_7"}"""
def getTargetIds(jsonData):
data = json.loads(jsonData)
for dest in data['to']['data']:
print("to_id:", dest.get('id', 'null'))
试一试:
>>> getTargetIds(jsonData)
to_id: 1543
to_id: null
或者,如果您只想跳过缺少ID的值而不是打印'null'
:
def getTargetIds(jsonData):
data = json.loads(jsonData)
for dest in data['to']['data']:
if 'id' in to_id:
print("to_id:", dest['id'])
所以:
>>> getTargetIds(jsonData)
to_id: 1543
当然,在现实生活中,你可能不希望print
每个id,而是存储它们并对它们做些什么,但这是另一个问题。
答案 4 :(得分:1)
您可以使用try-except
try:
print(str.to.id)
except AttributeError: # Not a Retweet
print('null')
答案 5 :(得分:0)
if "my_data" in my_json_data:
print json.dumps(my_json_data["my_data"])
答案 6 :(得分:0)
我为此目的编写了一个小函数。随时调整用途,
def is_json_key_present(json, key):
try:
buf = json[key]
except KeyError:
return False
return True