我将json数据加载并规范化为:
json_string = json.loads(data)
df_norm = json_normalize(json_string, errors='ignore')
说现在有2列:
Group Members
A [{'id':'1', 'metrics': '34', 'profile': 'abc'},{'id':'3',
'metrics': '32', 'profile': 'dc'}]
B [{'id':'2', 'metrics': '4', 'profile': 'bac'}]
我正在寻找一种方法来拆分“成员”列,并将其合并回到同一“组”下的原始数据框,例如:
Group Members id metrics profile
A {'id':'1', 'metrics': '34', 'profile': 'abc'},{'id':'3', 'metrics': '32', 'profile': 'dc'}] 1 34 abc
A {'id':'1', 'metrics': '34', 'profile': 'abc'},{'id':'3', 'metrics': '32', 'profile': 'dc'}] 3 32 dc
B [{'id':'2', 'metrics': '4', 'profile': 'bac'}] 4 4 bac
任何帮助将不胜感激。
答案 0 :(得分:0)
使用:
import ast
#if necessary convert column to list of dicts
df['Members'] = df['Members'].apply(ast.literal_eval)
#create DataFrames in list comprehension
df1 = pd.concat({k:pd.DataFrame(v) for k, v in df['Members'].items()})
#join to original
df = df.join(df1.reset_index(level=1, drop=True)).reset_index(drop=True)
print (df)
Group Members id metrics profile
0 A [{'id': '1', 'metrics': '34', 'profile': 'abc'... 1 34 abc
1 A [{'id': '1', 'metrics': '34', 'profile': 'abc'... 3 32 dc
2 B [{'id': '2', 'metrics': '4', 'profile': 'bac'}] 2 4 bac