我是编码的新手,目前正在努力想出一行代码来帮我解决这个问题。
在我的数据中,列出了延误时间,航班起点和目的地的航班列表。我想建议我应该使用什么样的代码来找到每个组合的原点,目的地和星期几的ARR_DELAY的中值。
非常感谢,感谢任何帮助。
答案 0 :(得分:0)
使用groupby
flights.groupby(['ORIGIN', 'DEST', 'DAY_OF_WEEK']).median()
如果NaNs没有延迟,你也可以先用0填充你的NaN:
flights = flights.fillna(0)
flights.groupby(['ORIGIN', 'DEST', 'DAY_OF_WEEK']).median()