我不得不绘制每年死亡人数的图表。所以我拿出了 年份从日期开始,然后按照它分组,然后我总结为我 每年死亡人数。但是当我运行时它会在整个数据集中给出我的死亡率。
我不明白为什么?以及任何其他替代方案每年都会发生死亡事故。
在数据集中,每次事故都会发生死亡,每年都会发生很多事故。
crash_data=read.csv("https://raw.githubusercontent.com/gluque/analytics_task2/master/Airplane_Crashes_and_Fatalities_Since_1908.csv")
> crash_data$Date <- as.Date(crash_data$Date, "%m/%d/%Y")
> crash_data$Date <- format(crash_data$Date, '%Y')
> cd<-subset(crash_data,select = c(Fatalities,Date))
> ab<-group_by(cd,Date)
> ef<-summarize(ab,Fatalities=sum(Fatalities,na.rm = TRUE))
> ef
Fatalities
1 105479
答案 0 :(得分:0)
> group_by(cd,Date) %>% summarize(Fatalities = sum(Fatalities, na.rm = TRUE))
# # A tibble: 98 x 2
# Date Fatalities
# <chr> <int>
# 1 1908 1
# 2 1912 5
# 3 1913 45
# 4 1915 40
# 5 1916 108
# 6 1917 124
# 7 1918 65
# 8 1919 5
# 9 1920 24
# 10 1921 68
# ... with 88 more rows