熊猫:将数据帧转换为列表的dict

时间:2016-05-11 01:37:56

标签: python pandas dataframe

我有一个这样的数据框:

col1, col2
A      0
A      1
B      2
C      3

我想得到这个:

{ A: [0,1], B: [2], C: [3] }

我试过了:

df.set_index('col1')['col2'].to_dict()

但这不太正确。我的第一个问题是'A'重复,我最终得到A:1(0被覆盖)。怎么修?

2 个答案:

答案 0 :(得分:6)

您可以在groupby上使用词典理解。

>>> {idx: group['col2'].tolist() 
     for idx, group in df.groupby('col1')}
{'A': [0, 1], 'B': [2], 'C': [3]}

答案 1 :(得分:4)

解决方案

df.groupby('col1')['col2'].apply(lambda x: x.tolist()).to_dict()

{'A': [0, 1], 'B': [2], 'C': [3]}