Question

我具有以下格式的数据框：

id, key1, key2
101, {'key': 'key_1001', 'fields': {'type': {'subtask': False}, 'summary': 'Title_1' , 'id': '71150'}}, NaN
101, NaN,{'key': 'key_1002', 'fields': {'type': {'subtask': False}, 'summary': 'Title_2' , 'id': '71151'}}
102, {'key': 'key_2001', 'fields': {'type': {'subtask': False}, 'summary': 'Title_11' , 'id': '71160'}}, NaN
102, NaN,{'key': 'key_2002', 'fields': {'type': {'subtask': False}, 'summary': 'Title_12' , 'id': '71161'}}

我正在尝试从上述数据框实现以下输出。

id, key_value_1, key_value_2
101, key_1001, key_1002
102, key_2001, key_2002

df.dict（）的输出

{'id': {103: '101', 676: '101'}, 'key1' : {103: {'fields': {'type': {'subtask': False}, 'summary': 'Title_1' , 'id': '71150'},
676: nan}

Answer 1

您可以使用：

s=df.set_index('id').stack().str.get('key').unstack()
         key1      key2
id                     
101  key_1001  key_1002
102  key_2001  key_2002

熊猫-基于公钥提取值

1 个答案: