假设我有一个看起来像这样的数据框:
interview longitude latitude
1 A1 34.2 90.2
2 A1 54.2 23.5
3 A3 32.1 21.5
4 A4 54.3 93.1
5 A2 45.1 29.5
6 A1 NaN NaN
7 A7 NaN NaN
8 A1 NaN NaN
9 A3 23.1 38.2
10 A5 -23.7 -98.4
我希望能够执行某种分组方法,将每个子组及其各自的经度和纬度输出。因此,类似这样的期望输出将是:
interview longitude latitude
1 A1 34.2 90.2
2 A1 54.2 23.5
6 A1 NaN NaN
8 A1 NaN NaN
5 A2 45.1 29.5
3 A3 32.1 21.5
9 A3 23.1 38.2
... and so on
因此,这需要循环执行,因为我将需要遍历每个子组的每一行。
我的目标是针对每次面试(A1,A2,...)找出哪个面试官(A1,A2,...)走了最长的距离-本质上,我只需要能够执行一些每个子组中的计算。我将如何迭代执行此分组方法,以便再次在每个子组中迭代执行操作,
谢谢!
答案 0 :(得分:1)
您可以在GroupBy
中循环浏览不同的组:
for name, group in df.groupby('interview'):
# perform some operations on group