在任意嵌套的JSON数据中访问特定字段

时间:2018-01-10 18:00:36

标签: python json list dictionary

{
  "status": "200",
  "msg": "",
  "data": {
    "time": "1515580011",
    "video_info": [
      {
          "announcement": "{\"announcement_id\":\"6\",\"name\":\"INS\\u8d26\\u53f7\",\"icon\":\"http:\\\/\\\/liveme.cms.ksmobile.net\\\/live\\\/announcement\\\/2017-08-18_19:44:54\\\/ins.png\",\"icon_new\":\"http:\\\/\\\/liveme.cms.ksmobile.net\\\/live\\\/announcement\\\/2017-10-20_22:24:38\\\/4.png\",\"videoid\":\"15154610218328614178\",\"content\":\"FOLLOW ME PLEASE\",\"x_coordinate\":\"0.22\",\"y_coordinate\":\"0.23\"}",
          "announcement_shop": "",

如何从这个json中获取内容“关注我?”

replay_data = raw_replay_data['data']['video_info'][0]
announcement = replay_data['announcement']

这会抓住所有内容['announcement']而我无法['announcement']['content']

这样做的正确方法是什么?

提前感谢您帮助我解决这个问题。

3 个答案:

答案 0 :(得分:18)

单行 -

>>> json.loads(data['data']['video_info'][0]['announcement'])['content']
'FOLLOW ME PLEASE'

为了帮助您了解如何访问数据(因此您无需再次询问),您需要盯着您的数据

首先,让我们很好地布置您的数据。您可以使用json.dumps(data, indent=4),也可以使用JSONLint.com等在线工具。

{
    'data': {
        'time': '1515580011',
        'video_info': [{
            'announcement': (    # ***
            """{
                "announcement_id": "6",
                "name": "INS\\u8d26\\u53f7",
                "icon": "http:\\\\/\\\\/liveme.cms.ksmobile.net\\\\/live\\\\/announcement\\\\/2017-08-18_19:44:54\\\\/ins.png",
                "icon_new": "http:\\\\/\\\\/liveme.cms.ksmobile.net\\\\/live\\\\/announcement\\\\/2017-10-20_22:24:38\\\\/4.png",
                "videoid": "15154610218328614178",
                "content": "FOLLOW ME PLEASE",
                "x_coordinate": "0.22",
                "y_coordinate": "0.23"
            }"""),
            'announcement_shop': ''
        }]
    },
    'msg': '',
    'status': '200'
} 

***请注意,announcement键中的数据实际上是 more json数据,我已在不同的行中列出。

首先,找出数据所在的位置。您正在查找content密钥中的数据,该密钥由announcement密钥访问,该密钥是字典列表中字典的一部分,可由{{1}访问},然后由video_info访问。

因此,总而言之,使用以下“梯级”“下降”作为“数据”的梯子 -

  1. data,字典
  2. data,一个词典列表
  3. video_info,在词典列表的第一个词典中的词典
  4. announcement作为json数据的一部分。
  5. 首先,

    content

    接下来,

    i = data['data']
    

    接下来,

    j = i['video_info']
    

    如果你只想要第一个元素,这就足够了。否则,您需要迭代

    k = j[0] # since this is a list
    

    接下来,

    for k in j:
        ...
    

    现在,l = k['announcement'] 是JSON数据。加载它 -

    l

    最后,

    import json
    m = json.loads(l)
    

    content = m['content']
    

    如果您将来有这种性质的询问,这应该可以作为指导。

答案 1 :(得分:3)

您有嵌套的JSON数据;与'annoucement'键关联的字符串本身是另一个独立的嵌入式JSON文档。

您必须首先解码该字符串:

import json

replay_data = raw_replay_data['data']['video_info'][0]
announcement = json.loads(replay_(data['announcement'])
print(announcement['content'])

然后从那里处理结果字典。

答案 2 :(得分:0)

"announcement"的内容是另一个JSON字符串。解码它,然后像对待外部对象一样访问其内容。