我有一个这样的数据框:
col1, col2
A 0
A 1
B 2
C 3
我想得到这个:
{ A: [0,1], B: [2], C: [3] }
我试过了:
df.set_index('col1')['col2'].to_dict()
但这不太正确。我的第一个问题是'A'重复,我最终得到A:1(0被覆盖)。怎么修?
答案 0 :(得分:6)
您可以在groupby上使用词典理解。
>>> {idx: group['col2'].tolist()
for idx, group in df.groupby('col1')}
{'A': [0, 1], 'B': [2], 'C': [3]}
答案 1 :(得分:4)
df.groupby('col1')['col2'].apply(lambda x: x.tolist()).to_dict()
{'A': [0, 1], 'B': [2], 'C': [3]}