R代码和nycflights13软件包中的数据浏览分析

时间:2019-01-30 16:24:49

标签: r dataframe

我试图查看每天发生的所有航班及其去向。最终我陷入了困境,我选择了想要选择的类别,使用过滤器来尝试获取所有具有365个航班的航班,但是它说没有数据,我不知道下一步应该做什么。

flights %>% 
  select(month, day, flight, carrier, origin, dest) %>%
  filter(sum(flight) == 365) %>%  
  view()

2 个答案:

答案 0 :(得分:1)

require(dplyr)
require(nycflights13)


flights %>%
  select(month, day, flight, carrier, origin, dest)   %>% 
  group_by(flight, carrier, origin, dest)             %>% 
  mutate(n_flights = n())                             %>%  
  ungroup                                             %>%  
  filter(n_flights == 365)                            %>% 
  head 

# 
# month   day flight carrier origin dest  n_flights
# <int> <int>  <int> <chr>   <chr>  <chr>     <int>
# 1     1     1    371 B6      LGA    FLL         365
# 2     1     1     59 AA      JFK    SFO         365
# 3     1     1    219 B6      JFK    CLT         365
# 4     1     1   1357 AA      JFK    SJU         365
# 5     1     1    407 VX      JFK    LAX         365
# 6     1     1    251 VX      JFK    LAS         365

答案 1 :(得分:0)

尝试以下操作:它使用summarise而不是mutate。您可以编辑自己的分组变量。

library(nycflights13)
flights %>% 
  select(month, day, flight, carrier, origin, dest) %>% 
  group_by(carrier,flight,origin,dest) %>% 
  dplyr::summarise(N=n()) %>% 
  arrange(desc(N)) %>% 
  filter(N==365) %>% 
  View()