在pandas数据框中有一个嵌套的嵌套列,我在json_normalize请求之后收到了这个列,如下所示:
{
'Speed':352,
'type':[
{
'details':'change\n',
'id':'3129f48c-23a6-49bd-9854',
'machine':'logs',
'Cause':{
'code':'051',
'description':'Error',
'id':'41827d41-75c5-4c88-9ec3',
'reason':'Error'
}
}
],
'endTime':1522844263021,
'line':'73c2f337-46fc-415c-a24f',
'level':1,
'lineId':'9b6a5624-4add-4fce-9de3',
'loss':0,
'startTime':1522842642200
}
如何在列中拆分?我尝试使用lambda这个但它给了我错误'list index out of range'
并且我不知道如何处理第二个嵌套:
df['details'] = df.loc[:, 'type'].apply(lambda x: x[0]['details'])
如何解决这项任务?
答案 0 :(得分:1)
json_normalize()的选项帮助我解决了这个问题:
df_df = json_normalize(df['values'], record_path=['type'], meta=['Speed','endTime', 'level','lineId', 'loss', 'startTime'])
答案 1 :(得分:0)
如果我理解您的问题,您正在使用多索引作为数据框的列。虽然我无法理解你正在尝试用它做什么。
如果您想访问子列"详细信息"尝试类似的事情:
df['type']['details']
我无法保证它能够正常运行,因为我无法使用您提供的数据重新创建数据框
也许这会有所帮助