我想在熊猫中创建一个精简的列联表。 因此,我从熊猫交叉表开始,基于示例中某个列的聚类,决策列为“ D”,例如
df = pd.DataFrame(np.random.randint(0,2,size=(4, 3)), columns=list('ABD'))
df
如果我想做交叉表,请通过以下命令:
pd.crosstab([df.A,df.B], df.D, margins=True)
返回频率表:
这对我来说有点不方便。
我想在整个数据帧上执行此操作,而不是像在我传递列列表的示例中那样逐列进行操作。 另外,我希望它以更简洁的方式返回,而不是像这样的超大频率返回:
有什么想法去那里吗?
谢谢