Pandas groupby找到真和假的百分比

时间:2015-05-18 19:18:39

标签: python python-2.7 pandas

我有一系列网站:['加拿大','美国'中国' ....]

每个站点在SITE列中多次出现,每个实例旁边都有一个真值或假值。

INDEX | VALUE | SITE

0     | True  | Canada
1     | False | Canada
2     | True  | USA
3     | True  | USA

它继续。

目标1:我想为每个网站找到VALUE列的百分比为真。

目标2:我想返回一个网站列表,其中VALUE列中的%True大于10%。

如何使用groupby来实现这一目标?我只知道如何使用groupby找到每个网站的平均值,这对我来说不会有帮助。

1 个答案:

答案 0 :(得分:7)

这样的事情:

In [13]: g = df.groupby('SITE')['VALUE'].mean()
In [14]: g[g > 0.1]
Out[14]: 
SITE
Canada    0.5
USA       1.0