下面是我的数据框示例和我希望从中计算出的内容的字典。我目前的方法涉及遍历唯一的 ColA 值,创建一个子集数据框,获取 ColB 值的列表,并从中制作一个 dict。问题是我有超过一百万个独特的 ColA 值要循环。有什么想法吗??
DF
ColA ColB
mike 34
mike 3
mike 10
bill 80
dean 2
dean 4
dean 44
dean 56
想要的字典 = {'mike':[34,3,10], 'bill': [10], 'dean': [2,4,44,56]}
有什么想法吗?谢谢!!
答案 0 :(得分:3)
out = df.groupby("ColA")["ColB"].agg(list).to_dict()
print(out)
打印:
{'bill': [80], 'dean': [2, 4, 44, 56], 'mike': [34, 3, 10]}