从数据框创建嵌套字典,其中第一列是父字典的键

时间:2020-06-11 15:50:10

标签: python pandas dataframe dictionary

我正在尝试从pandas数据框创建嵌套字典。第一个列值应该是上级词典的键,它将污染其他列作为词典,其中列标题是键。我想避免循环。

数据框:

df = pd.DataFrame({'A': [11, 11, 11, 11, 11, 11, 12, 12],
                   'B': [1, 2, 3, 1, 2, 3, 4, 5],
                   'C': [1.0, 0.7, 0.3, 1.0, 0.7, 0.3, 1.0, 1.0]})

我想拥有什么:

dict_expt = {'11': {'B': [1, 2, 3],
                  'C': [1.0, 0.7, 0.3]},
           '12': {'B': [4, 5],
                  'C': [1.0]}}

我尝试过的事情:

df.groupby(['A']).agg({'B':lambda x: list(x.unique()),
                      'C':lambda x: list(x.unique())}).to_dict()

不幸地返回:

{'B': 
     {11: [1, 2, 3], 
      12: [4, 5]}, 
'C': {11: [1.0, 0.7, 0.3], 
      12: [1.0]}}

我们非常感谢您的帮助。谢谢

1 个答案:

答案 0 :(得分:1)

您已经接近,只需将"index"添加到to_dict()

df.groupby(['A']).agg({'B':lambda x: list(x.unique()),
                      'C':lambda x: list(x.unique())}).to_dict("index")

输出:

{11: {'B': [1, 2, 3], 'C': [1.0, 0.7, 0.3]}, 12: {'B': [4, 5], 'C': [1.0]}}