Question

假设我有一个看起来像这样的数据框：

    interview       longitude        latitude
1   A1                  34.2             90.2
2   A1                  54.2             23.5
3   A3                  32.1             21.5
4   A4                  54.3             93.1
5   A2                  45.1             29.5
6   A1                  NaN              NaN
7   A7                  NaN              NaN
8   A1                  NaN              NaN
9   A3                  23.1             38.2
10  A5                  -23.7            -98.4

我希望能够执行某种分组方法，将每个子组及其各自的经度和纬度输出。因此，类似这样的期望输出将是：

    interview         longitude         latitude 
1   A1                  34.2             90.2
2   A1                  54.2             23.5
6   A1                  NaN              NaN
8   A1                  NaN              NaN

5   A2                  45.1             29.5

3   A3                  32.1             21.5
9   A3                  23.1             38.2

... and so on

因此，这需要循环执行，因为我将需要遍历每个子组的每一行。

我的目标是针对每次面试（A1，A2，...）找出哪个面试官（A1，A2，...）走了最长的距离-本质上，我只需要能够执行一些每个子组中的计算。我将如何迭代执行此分组方法，以便再次在每个子组中迭代执行操作，

谢谢！

Answer 1

您可以在GroupBy中循环浏览不同的组：

for name, group in df.groupby('interview'):
    # perform some operations on group

如何对项目进行分组然后遍历子组

1 个答案: