Question

下面是我的数据框示例和我希望从中计算出的内容的字典。我目前的方法涉及遍历唯一的 ColA 值，创建一个子集数据框，获取 ColB 值的列表，并从中制作一个 dict。问题是我有超过一百万个独特的 ColA 值要循环。有什么想法吗？？

DF

 ColA       ColB
 mike        34
 mike         3
 mike        10
 bill        80
 dean         2
 dean         4
 dean        44
 dean        56

想要的字典 = {'mike':[34,3,10], 'bill': [10], 'dean': [2,4,44,56]}

有什么想法吗？谢谢！！

Answer 1

out = df.groupby("ColA")["ColB"].agg(list).to_dict()
print(out)

打印：

{'bill': [80], 'dean': [2, 4, 44, 56], 'mike': [34, 3, 10]}