Pandas Dataframe中的嵌套嵌套列

时间:2018-05-22 12:05:57

标签: python json pandas lambda nested

在pandas数据框中有一个嵌套的嵌套列,我在json_normalize请求之后收到了这个列,如下所示:

  {  
   'Speed':352,
   'type':[  
      {  
         'details':'change\n',
         'id':'3129f48c-23a6-49bd-9854',
         'machine':'logs',
         'Cause':{  
            'code':'051',
            'description':'Error',
            'id':'41827d41-75c5-4c88-9ec3',
            'reason':'Error'
         }
      }
   ],
   'endTime':1522844263021,
   'line':'73c2f337-46fc-415c-a24f',
   'level':1,
   'lineId':'9b6a5624-4add-4fce-9de3',
   'loss':0,
   'startTime':1522842642200
}

如何在列中拆分?我尝试使用lambda这个但它给了我错误'list index out of range'并且我不知道如何处理第二个嵌套:

df['details'] = df.loc[:, 'type'].apply(lambda x: x[0]['details'])

如何解决这项任务?

2 个答案:

答案 0 :(得分:1)

json_normalize()的选项帮助我解决了这个问题:

df_df = json_normalize(df['values'], record_path=['type'], meta=['Speed','endTime', 'level','lineId', 'loss', 'startTime'])

答案 1 :(得分:0)

如果我理解您的问题,您正在使用多索引作为数据框的列。虽然我无法理解你正在尝试用它做什么。

如果您想访问子列"详细信息"尝试类似的事情:

df['type']['details']

我无法保证它能够正常运行,因为我无法使用您提供的数据重新创建数据框

也许这会有所帮助

https://pandas.pydata.org/pandas-docs/stable/advanced.html