从没有循环的数据帧创建字典

时间:2021-05-12 20:04:14

标签: python pandas dataframe

下面是我的数据框示例和我希望从中计算出的内容的字典。我目前的方法涉及遍历唯一的 ColA 值,创建一个子集数据框,获取 ColB 值的列表,并从中制作一个 dict。问题是我有超过一百万个独特的 ColA 值要循环。有什么想法吗??

DF

 ColA       ColB
 mike        34
 mike         3
 mike        10
 bill        80
 dean         2
 dean         4
 dean        44
 dean        56

想要的字典 = {'mike':[34,3,10], 'bill': [10], 'dean': [2,4,44,56]}

有什么想法吗?谢谢!!

1 个答案:

答案 0 :(得分:3)

out = df.groupby("ColA")["ColB"].agg(list).to_dict()
print(out)

打印:

{'bill': [80], 'dean': [2, 4, 44, 56], 'mike': [34, 3, 10]}