Question

我有一个pandas multiindex数据框，我试图输出为嵌套字典。

# create the dataset
data = {'clump_thickness': {(0, 0): 274.0, (0, 1): 19.0, (1, 0): 67.0, (1, 1): 12.0, (2, 0): 83.0, (2, 1): 45.0, (3, 0): 16.0, (3, 1): 40.0, (4, 0): 4.0, (4, 1): 54.0, (5, 0): 0.0, (5, 1): 69.0, (6, 0): 0.0, (6, 1): 0.0, (7, 0): 0.0, (7, 1): 0.0, (8, 0): 0.0, (8, 1): 0.0, (9, 0): 0.0, (9, 1): 0.0}}
df = pd.DataFrame(data)
df.head()
#      clump_thickness
# 0 0            274.0
#   1             19.0
# 1 0             67.0
#   1             12.0
# 2 0             83.0

df是我想要作为嵌套字典输出的数据框。我要查找的输出格式为 -

{"0":
{
  "0":274,
  "1":19
},
"1":{
  "0":67,
  "1":12
},
"2":{
  "0":83,
  "1":45
},
"3":{
  "0":16,
  "1":40
},
"4":{
  "0":4,
  "1":54
},
"5":{
  "0":0,
  "1":69
}
}

这里第一个索引构成了最外层字典的键。对于每个键，我们都存储了一个字典，其键是第二个索引中的值。

当我执行df.to_dict()时，而不是嵌套，而是将多索引作为元组返回。我如何实现这一目标？

Answer 1

对我来说工作：

d = {l: df.xs(l)['clump_thickness'].to_dict() for l in df.index.levels[0]}

另一种类似DataFrame with MultiIndex to dict 的解决方案，但是Series的必要过滤器列：

d = df.groupby(level=0).apply(lambda df: df.xs(df.name).clump_thickness.to_dict()).to_dict()

print (d)

{0: {0: 274.0, 1: 19.0},
 1: {0: 67.0, 1: 12.0},
 2: {0: 83.0, 1: 45.0},
 3: {0: 16.0, 1: 40.0},
 4: {0: 4.0, 1: 54.0},
 5: {0: 0.0, 1: 69.0},
 6: {0: 0.0, 1: 0.0},
 7: {0: 0.0, 1: 0.0},
 8: {0: 0.0, 1: 0.0},
 9: {0: 0.0, 1: 0.0}}

Answer 2

df.unstack().clump_thickness.apply(lambda x: x.to_dict(), axis=1).to_dict()

将pandas multiindex数据帧转换为嵌套字典

2 个答案: