Pandas中是否有一种无需命名特定列即可进行groupby()和count()的方法? 因此,通常在具有A-D列的数据帧(df)中,我可以
df.groupby(["A","B"]).count()
这将给我两行(C,D),其中包含C,D的非空(非Nan)值的计数,其中A和B具有相同的值。很好,但是通常我只是想知道有多少行具有相同的A和B组合,而与当前调用的C和D以及它们的值无关。
我也可以只选择其中一列,而只获得包含计数的一列
df.groupby(["A","B"])["c"].count()
但是为此,我需要确保C始终存在并且被命名为“ C”。当然,我可以添加一个虚拟列
df.assign(dummy=1).groupby(["A","B"])["dummy"].count()
但是我想知道是否没有更多的海峡前进方式。