对于模糊的标题感到抱歉,但我不知道如何说出来。
所以我有一个包含3列和任意行数的pandas数据帧。第一列是一个人的名字,第二列是他们的专业(六个可能的专业,总是写相同),第三列是他们的性别(总是'男'或'女')。
我被告知打印出每个专业的人数,我可以通过说table.Qmajor.value_counts()(表格是我的数据帧变量名称)来完成。现在我被要求打印每个专业的男性和女性数量,我不知道从哪里开始。任何帮助表示赞赏。
列名是Qnames,Qmajor和Qgender。
答案 0 :(得分:2)
改变@ VaishaliGarg的答案, 你可以用
df.groupby(['Qgender','Qmajor']).count()
如果需要一个数据帧,我们需要添加.reset_index() 因为它将是一个groupbyObject。
df.groupby(['Qgender','Qmajor']).count().reset_index()