我有一张桌子,上面有关于地区的一些信息。我已将其转换为熊猫数据框,我的问题是如何计算下表中出现SOUTHERN,BAYVIEW等的次数?我想在地区旁边添加一个额外的列,其中包含每个地区的总数。
District
0 SOUTHERN
1 BAYVIEW
2 CENTRAL
3 NORTH
答案 0 :(得分:1)
这里您需要使用groupby
和size
方法(也可以使用其他一些聚合,例如count)
使用此数据框:
import pandas as pd
df = pd.DataFrame({'DISTRICT': ['SOUTHERN', 'SOUTHERN', 'BAYVIEW', 'BAYVIEW', 'BAYVIEW', 'CENTRAL', 'NORTH']})
表示如下
DISTRICT
0 SOUTHERN
1 SOUTHERN
2 BAYVIEW
3 BAYVIEW
4 BAYVIEW
5 CENTRAL
6 NORTH
您可以使用
df.groupby(['DISTRICT']).size().reset_index(name='counts')
您有此输出
DISTRICT counts
0 BAYVIEW 3
1 CENTRAL 1
2 NORTH 1
3 SOUTHERN 2