解决方案

Question

我有一个这样的数据框：

col1, col2
A      0
A      1
B      2
C      3

我想得到这个：

{ A: [0,1], B: [2], C: [3] }

我试过了：

df.set_index('col1')['col2'].to_dict()

但这不太正确。我的第一个问题是'A'重复，我最终得到A：1（0被覆盖）。怎么修？

Answer 1

您可以在groupby上使用词典理解。

>>> {idx: group['col2'].tolist() 
     for idx, group in df.groupby('col1')}
{'A': [0, 1], 'B': [2], 'C': [3]}

Answer 2

df.groupby('col1')['col2'].apply(lambda x: x.tolist()).to_dict()

{'A': [0, 1], 'B': [2], 'C': [3]}