我正试图找出哪些目的地的延迟航班率最高。例如,洛杉矶国际机场有10个航班,其中3个航班延误,那么洛杉矶国际机场的延误率为30%。到目前为止,这是我无法正确制定公式的方法。
flights %>%
group_by(dest) %>%
summarise(delay_rate = n_distinct(flight) / n_distinct(dep_delay)) %>%
arrange(desc(delay_rate)) %>%
view()
答案 0 :(得分:0)
flights %>%
group_by(dest) %>%
summarise(delay_rate = n_distinct(dep_delay > 0) / n() * 100) %>%
arrange(desc(delay_rate)) %>%
View()
其中n_distinct(dep_delay > 0)
是延误的航班数
而n()
是航班总数