我有一个pandas multiindex数据框,我试图输出为嵌套字典。
# create the dataset
data = {'clump_thickness': {(0, 0): 274.0, (0, 1): 19.0, (1, 0): 67.0, (1, 1): 12.0, (2, 0): 83.0, (2, 1): 45.0, (3, 0): 16.0, (3, 1): 40.0, (4, 0): 4.0, (4, 1): 54.0, (5, 0): 0.0, (5, 1): 69.0, (6, 0): 0.0, (6, 1): 0.0, (7, 0): 0.0, (7, 1): 0.0, (8, 0): 0.0, (8, 1): 0.0, (9, 0): 0.0, (9, 1): 0.0}}
df = pd.DataFrame(data)
df.head()
# clump_thickness
# 0 0 274.0
# 1 19.0
# 1 0 67.0
# 1 12.0
# 2 0 83.0
df
是我想要作为嵌套字典输出的数据框。我要查找的输出格式为 -
{"0":
{
"0":274,
"1":19
},
"1":{
"0":67,
"1":12
},
"2":{
"0":83,
"1":45
},
"3":{
"0":16,
"1":40
},
"4":{
"0":4,
"1":54
},
"5":{
"0":0,
"1":69
}
}
这里第一个索引构成了最外层字典的键。对于每个键,我们都存储了一个字典,其键是第二个索引中的值。
当我执行df.to_dict()
时,而不是嵌套,而是将多索引作为元组返回。我如何实现这一目标?
答案 0 :(得分:4)
对我来说工作:
d = {l: df.xs(l)['clump_thickness'].to_dict() for l in df.index.levels[0]}
另一种类似DataFrame with MultiIndex to dict 的解决方案,但是Series
的必要过滤器列:
d = df.groupby(level=0).apply(lambda df: df.xs(df.name).clump_thickness.to_dict()).to_dict()
print (d)
{0: {0: 274.0, 1: 19.0},
1: {0: 67.0, 1: 12.0},
2: {0: 83.0, 1: 45.0},
3: {0: 16.0, 1: 40.0},
4: {0: 4.0, 1: 54.0},
5: {0: 0.0, 1: 69.0},
6: {0: 0.0, 1: 0.0},
7: {0: 0.0, 1: 0.0},
8: {0: 0.0, 1: 0.0},
9: {0: 0.0, 1: 0.0}}
答案 1 :(得分:-1)
df.unstack().clump_thickness.apply(lambda x: x.to_dict(), axis=1).to_dict()