熊猫groupby并仅转换一列

时间:2020-02-08 14:36:53

标签: python python-3.x pandas

我想对分组的列进行分组和转换。

假设我有这样的数据框:

dataf = pd.DataFrame({'question': ['q1', 'q1', 'q1', 'q2', 'q2', 'q2', 'q3', 'q3', 'q3']*10, 'value': [1,2,3,1,2,3,1,2,3]*10})
datafG = dataf.groupby(['question', 'value']).agg({'value': 'count'})
datafG['sum_n'] = datafG.groupby(['question']).transform('sum')

然后我要分组并获取计数列datafG / datafG.groupby(level=[0]).transform('sum')的比例,但这将同时改变两者,我正在寻找一种方法来保持我的sum_n列不变。

这给了我一个像这样的df:

                    value   sum_n
question    value   
q1          1       0.33    0.33
q1          2       0.33    0.33
q1          3       0.33    0.33
q2          1       0.33    0.33
q2          2       0.33    0.33
q2          3       0.33    0.33
q3          1       0.33    0.33
q3          2       0.33    0.33
q3          3       0.33    0.33

我想要的时候:

                    value   sum_n
question    value   
q1          1       0.33    30
q1          2       0.33    30
q1          3       0.33    30
q2          1       0.33    30
q2          2       0.33    30
q2          3       0.33    30
q3          1       0.33    30
q3          2       0.33    30
q3          3       0.33    30

0 个答案:

没有答案