我在pandas df中有一张桌子
product_id_x product_id_y
1 2
1 3
1 4
3 7
3 11
3 14
3 2
and so on around (1000 rows)
我想找到每个product_id_x与product_id_y的组合计数。
即。 1与1-2,1-3,1-4组合(共3种组合) 类似地,3总共有4种组合。
并创建一个具有
的数据帧df2product_id_x combinations
1 3
3 4
and so on ..(distinct product_id_x's)
我应该遵循什么方法? 我在python上的技巧处于初级水平。 提前谢谢。
答案 0 :(得分:2)
您可以在product_id_x
列上使用groupby
with agg
:
df2 = df.groupby(['product_id_x']).agg(['count'])
或者,您可以直接在组上使用size
函数来获取每个组的大小:
df2 = df.groupby(['product_id_x']).size()
答案 1 :(得分:2)