数据框如下
id | 年龄 |
---|---|
一 | 30-40 |
b | 30-40 |
c | 30-40 |
d | 40-50 |
e | 40-50 |
'30-40' 的计数为 3,'40-50' 的计数为 2。 我想要的输出只是值,我不在乎格式。 这是输出
年龄 | 百分比 |
---|---|
30-40 | 60.00% |
40-50 | 40.00% |
答案 0 :(得分:1)
使用 Series.value_counts
和 normalize=True
,然后乘以 100
并将格式更改为 DataFrame
:
df1 = (df['age'].value_counts(normalize=True)
.mul(100)
.rename_axis('age')
.reset_index(name='percentage'))
print (df1)
age percentage
0 30-40 60.0
1 40-50 40.0