通过数据框进行分组,并找出另一列的最大出现次数

时间:2018-09-02 18:36:22

标签: pandas-groupby

我必须在python 3.x中的数据帧上使用groupby()。列名是Origin,然后根据原点,我必须找出出现次数最多的目的地。

样本df就像:

    year    month   day dep_time    sched_dep_time  dep_delay   arr_time    sched_arr_time  arr_delay   origin  dest
0   2013    1       1   517         515              2          830         819              11         EWR     IAH
1   2013    1       1   533         529              4          850         830              20         LGA     IAH
2   2013    1       1   542         540              2          923         850              33         JFK     MIA
3   2013    1       1   544         545             -1          1004        1022            -18         JFK     BQN
4   2013    1       1   554         600             -6          812         837             -25         LGA     ATL
5   2013    1       1   554         558             -4          740         728              12         EWR     ORD
6   2013    1       1   555         600             -5          913         854              19         EWR     FLL
7   2013    1       1   557         600             -3          709         723             -14         LGA     IAD
8   2013    1       1   557         600             -3          838         846              -8         JFK     MCO
9   2013    1       1   558         600             -2          753         745               8         LGA     ORD

2 个答案:

答案 0 :(得分:0)

您可以使用以下内容找出另一列的最大出现次数:

df.groupby(['origin'])['dest'].size().reset_index()

    origin  dest
0   EWR     3
1   JFK     3
2   LGA     4

答案 1 :(得分:0)

您可以使用聚合函数来简化生活,并在上面绘制图表。

fun={'dest':{'Count':'count'} 
df= df.groupby(['origin','dest']).agg(fun).reset_index()
df.columns=df.columns.droplevel(1)
df