我有一个这样的数据框:
如何添加这样的另一列:
值49.11%等于“国家和城市”组的总和(30.2 + 20.8 + 10.5)乘以30.2。
我使用groupby
和sum()
来获得每种(country - city
)组合的总和,但无法获得循环来填充百分比列。
谢谢。
答案 0 :(得分:0)
我认为您正在寻找转换
df['percentage'] = df.groupby(['country', 'city'])['length'].transform(lambda z: z / z.sum() * 100)