我在R中一直在努力解决这个问题。基本上,我已经选择了一些由于航空公司而导致航班延误的城市,我需要弄清楚航班的总数那些城市(延迟或没有延迟)。我可以通过以下方式轻松获得每个城市的航班总数:
count(flights, ORIGIN_CITY_NAME)
但我无法将其与我的数据框相匹配,因为它们不会有相同的行数。如何过滤该列表,使其仅包含在carrierDelayed中找到的城市?
require("dplyr")
flights <- read.csv("airplaneData.csv", header = TRUE, sep = ",")
carrierDelayed <- subset(flights, flights$CARRIER_DELAY > 0)
carrierPercent <- data.frame(unique(carrierDelayed$ORIGIN_CITY_NAME), /* Total Count Should Go Here */)