如何对项目进行分组然后遍历子组

时间:2019-01-14 21:34:29

标签: python pandas dataframe pandas-groupby

假设我有一个看起来像这样的数据框:

    interview       longitude        latitude
1   A1                  34.2             90.2
2   A1                  54.2             23.5
3   A3                  32.1             21.5
4   A4                  54.3             93.1
5   A2                  45.1             29.5
6   A1                  NaN              NaN
7   A7                  NaN              NaN
8   A1                  NaN              NaN
9   A3                  23.1             38.2
10  A5                  -23.7            -98.4

我希望能够执行某种分组方法,将每个子组及其各自的经度和纬度输出。因此,类似这样的期望输出将是:

    interview         longitude         latitude 
1   A1                  34.2             90.2
2   A1                  54.2             23.5
6   A1                  NaN              NaN
8   A1                  NaN              NaN

5   A2                  45.1             29.5

3   A3                  32.1             21.5
9   A3                  23.1             38.2

... and so on

因此,这需要循环执行,因为我将需要遍历每个子组的每一行。

我的目标是针对每次面试(A1,A2,...)找出哪个面试官(A1,A2,...)走了最长的距离-本质上,我只需要能够执行一些每个子组中的计算。我将如何迭代执行此分组方法,以便再次在每个子组中迭代执行操作,

谢谢!

1 个答案:

答案 0 :(得分:1)

您可以在GroupBy中循环浏览不同的组:

for name, group in df.groupby('interview'):
    # perform some operations on group