Question

我有一系列网站：[＆＃39;加拿大＆＃39;，＆＃39;美国＆＃39;中国＆＃39; ....]

每个站点在SITE列中多次出现，每个实例旁边都有一个真值或假值。

INDEX | VALUE | SITE

0     | True  | Canada
1     | False | Canada
2     | True  | USA
3     | True  | USA

它继续。

目标1：我想为每个网站找到VALUE列的百分比为真。

目标2：我想返回一个网站列表，其中VALUE列中的％True大于10％。

如何使用groupby来实现这一目标？我只知道如何使用groupby找到每个网站的平均值，这对我来说不会有帮助。

Answer 1

这样的事情：

In [13]: g = df.groupby('SITE')['VALUE'].mean()
In [14]: g[g > 0.1]
Out[14]: 
SITE
Canada    0.5
USA       1.0