Question

在pandas数据框中有一个嵌套的嵌套列，我在json_normalize请求之后收到了这个列，如下所示：

  {  
   'Speed':352,
   'type':[  
      {  
         'details':'change\n',
         'id':'3129f48c-23a6-49bd-9854',
         'machine':'logs',
         'Cause':{  
            'code':'051',
            'description':'Error',
            'id':'41827d41-75c5-4c88-9ec3',
            'reason':'Error'
         }
      }
   ],
   'endTime':1522844263021,
   'line':'73c2f337-46fc-415c-a24f',
   'level':1,
   'lineId':'9b6a5624-4add-4fce-9de3',
   'loss':0,
   'startTime':1522842642200
}

如何在列中拆分？我尝试使用lambda这个但它给了我错误'list index out of range'并且我不知道如何处理第二个嵌套：

df['details'] = df.loc[:, 'type'].apply(lambda x: x[0]['details'])

如何解决这项任务？

Answer 1

json_normalize（）的选项帮助我解决了这个问题：

df_df = json_normalize(df['values'], record_path=['type'], meta=['Speed','endTime', 'level','lineId', 'loss', 'startTime'])

Answer 2

如果我理解您的问题，您正在使用多索引作为数据框的列。虽然我无法理解你正在尝试用它做什么。

如果您想访问子列＆＃34;详细信息＆＃34;尝试类似的事情：

df['type']['details']

我无法保证它能够正常运行，因为我无法使用您提供的数据重新创建数据框

也许这会有所帮助

https://pandas.pydata.org/pandas-docs/stable/advanced.html

Pandas Dataframe中的嵌套嵌套列

2 个答案: