使用nycfights13软件包在R中进行数据分析

时间:2019-01-30 20:15:47

标签: r database data-extraction

我正试图找出哪些目的地的延迟航班率最高。例如,洛杉矶国际机场有10个航班,其中3个航班延误,那么洛杉矶国际机场的延误率为30%。到目前为止,这是我无法正确制定公式的方法。

flights %>% 
  group_by(dest) %>% 
  summarise(delay_rate = n_distinct(flight) / n_distinct(dep_delay)) %>% 
  arrange(desc(delay_rate)) %>% 
  view()

1 个答案:

答案 0 :(得分:0)

flights %>% 
  group_by(dest) %>% 
  summarise(delay_rate = n_distinct(dep_delay > 0) / n() * 100) %>% 
  arrange(desc(delay_rate)) %>% 
  View()

其中n_distinct(dep_delay > 0)是延误的航班数 而n()是航班总数