标签: python
我有一个包含4列的数据框df,假设a,b,c,d。假设a是主题,b是性别,c是分数,d是2或 5.我想根据主题和性别对数据进行分组,然后根据得分c将分组的数据分为d组,然后将其存储到新列e
这是我的以下示例代码:
df['e'] = df.groupby([a,b])['c'].transform(lambda x: pd.qcut(x, 5, labels=np.arange(5, 0, -1)))
这仅在我的类别数是静态的而不是动态的(如我希望它基于d列)的情况下有效