python中的Groupby

时间:2015-10-19 03:42:24

标签: python pandas

以下是我的数据示例:Data Snapshot

我的问题陈述是:我必须找到最多请求的前20种语言

我想用熊猫来做这件事。

请帮助!!

1 个答案:

答案 0 :(得分:1)

使用groupby并切片前20

In [4]: df
Out[4]:
  language page_name  requests  bytes
0       en         a         1    220
1       eu         b         1    620
2       eu         b         1    620
3       tr         c         1    780
4       en         d         4    620
5       en         e         9   1320

In [5]: df.groupby('language')['requests'].sum()
Out[5]:
language
en    14
eu     2
tr     1
Name: requests, dtype: int64

In [6]: df.groupby('language')['requests'].sum()[:20]
Out[6]:
language
en    14
eu     2
tr     1
Name: requests, dtype: int64