我有一个包含几个不同列的数据框,我想对df [x] = df [y]的计数求和。
因此,为了举例说明我要做的事情,我将使用两个示例列。
想象一个具有FAVORITE_COLORS列和COUNTRY列的DF。
我想对所有这些不同的组合求和,即英格兰有多少次使用喜欢的颜色“蓝色”,“黄色”等,并将其存储在df中。
所以我想要的输出将是
COUNTRY BLUE YELLOW COLOR...
0 England 1232 3312 Sum
1 Hungary 5543 7661 Sum
2 ETC ETC ETC
当我创建一个仅包含匹配项的新df时,我尝试使用pythons len(df)来使用pandas groupby和count,但是它看起来非常笨拙,我无法使其正常工作。
关于如何处理此问题的任何想法?
预先感谢