我有一个这样组织的数据框:
Genre_Desig Genre_Demographic demo1 demo2 demo3 demo4
Genre_1 demo1 1 2 3 4
Genre_1 demo2 5 6 7 8
Genre_1 demo3 9 0 1 2
Genre_1 demo4 3 4 5 6
Genre_2 demo1 7 8 9 0
Genre_2 demo2 1 2 3 4
此表针对8种不同类型继续进行,每种类型具有相同数量的n个演示。
我想找到
1)整个流派的演示的每一列的总数,并通过每种流派的总数归一化
和
2)每个流派组中每一行的总计,以使“ Genre_Demographic”中的每个演示都具有与之关联的总计(逐行)。然后,我想通过此相应的总数归一化每一行。
在前一种情况下,是否可以在每个流派组的末尾将该列的总计作为新行?
到目前为止,我有:
normalized = df/df.groupby('Genre_Desig').sum()
对于列式规范化BUT,这在我得到时不起作用:
Genre_Desig Genre_Demographic demo1 demo2 demo3 demo4
Nan Nan Nan Nan Nan Nan
Nan Nan Nan Nan Nan Nan
Nan Nan Nan Nan Nan Nan
Nan Nan Nan Nan Nan Nan
Nan Nan Nan Nan Nan Nan