我有一个数据框,我正在进行groupby()
以获取列值的计数。我正在尝试为“总百分比”添加一个额外的列。我不知道如何做到这一点。
我看了几个groupby选项,但似乎找不到合适的东西。
我的数据框如下所示:
DAYSLATE
DAYSLATE
-7 days 1
-5 days 2
-3 days 8
-2 days 9
-1 days 45
0 days 589
1 days 33
2 days 8
3 days 16
4 days 14
5 days 16
6 days 2
7 days 6
8 days 2
9 days 2
10 days 1
答案 0 :(得分:15)
选项1
df['DAYSLATE_pct'] = df.DAYSLATE / df.DAYSLATE.sum()
选项2
使用pd.value_counts
代替groupby
pre_df.DAYSLATE.value_counts(normalize=True)