熊猫数据框以字典中的唯一值作为键并以嵌套列表作为值来进行字典

时间:2018-09-20 11:21:29

标签: pandas dictionary dataframe python-3.6 pandas-groupby

我正在尝试将数据框转换为字典,并使用列(col 3)中的唯一值作为键。

从此:

  Col1   Col2   Col3
0  a       b      x
1  c       d      x
2  e       f      y
3  g       h      y

对此:

{x:[[a,b][c,d]],y:[[e,f],[g,h]]}

使用以下代码,我得到了元组,但实际上并不能解决我的问题。

new_dict = df.groupby('col3').apply(lambda x: list(zip(x['col1'],x['col2']))).to_dict()

输出:

{x:[(a,b),(c,d)],y:[(e,f),(g,h)]}

1 个答案:

答案 0 :(得分:2)

使用map列出或列出理解:

new_dict = (df.groupby('col3')
              .apply(lambda x: list(map(list, zip(x['col1'],x['col2']))))
              .to_dict())
print (new_dict)
{'x': [['a', 'b'], ['c', 'd']], 'y': [['e', 'f'], ['g', 'h']]}

new_dict = (df.groupby('col3')
              .apply(lambda x: [list(y) for y in zip(x['col1'],x['col2'])])
              .to_dict())

另一种解决方案是将每个组转换为2d数组并转换为list

new_dict = df.groupby('col3')['col1','col2'].apply(lambda x: x.values.tolist()).to_dict()