我正在使用R处理this数据集,并试图显示每年的事件数量。
我使用R的帮助页面写道:
getData=read.csv('planecrashinfo_20181121001952.csv')
attach(getData)
lct <- Sys.getlocale("LC_TIME"); Sys.setlocale("LC_TIME", "C")
getData$date<-as.Date(date, format='%B %d, %Y')
可以,但是使用
hist(date, "years", format= '%Y')
结果
“ hist.default(日期,“年”,格式=“%Y”)中的错误:'x'代表数字”。
我有没有使用的包裹吗?
答案 0 :(得分:2)
我建议对日期字段使用lubridate
:
library(readr)
library(lubridate)
library(ggplot2)
getData <- read_csv("planecrashinfo_20181121001952.csv")
getData$date <- mdy(getData$date)
hist(year(getData$date))
或与ggplot
ggplot(data = getData , aes(x = year(date))) +
geom_histogram(binwidth = 1)