我有一系列网站:['加拿大','美国'中国' ....]
每个站点在SITE列中多次出现,每个实例旁边都有一个真值或假值。
INDEX | VALUE | SITE
0 | True | Canada
1 | False | Canada
2 | True | USA
3 | True | USA
它继续。
目标1:我想为每个网站找到VALUE列的百分比为真。
目标2:我想返回一个网站列表,其中VALUE列中的%True大于10%。
如何使用groupby来实现这一目标?我只知道如何使用groupby找到每个网站的平均值,这对我来说不会有帮助。
答案 0 :(得分:7)
这样的事情:
In [13]: g = df.groupby('SITE')['VALUE'].mean()
In [14]: g[g > 0.1]
Out[14]:
SITE
Canada 0.5
USA 1.0