R中列中的多个日期,缺失时间和NA值

时间:2018-06-03 14:12:01

标签: r

我有一个数据集,其中包含日期时间列,但格式混乱,最难的是该列还有NA

date_time <- c("11/7/2016 14:11", "12-11-2016 2:00:54", "NA", "12/7/2016 22:03")

我需要忽略NA值,要插入的秒数和要统一的日期格式。

使用gsub(pattern ='-', replacement='/', date_test)我可以修复日期格式

当我使用as.Dateas.POSIX应用任何日期时间格式时,会产生NA值,因为某些时间没有秒。该表已有NA个值,因此我会丢失值。

我需要将时间整理为分钟或插入虚拟秒数,然后将其格式化为日期时间NA

由于

1 个答案:

答案 0 :(得分:0)

根据输入,如果我们有多种格式,则parse_date_time

中的一个选项为lubridate
library(lubridate)
parse_date_time(date_time, c("%m/%d/%Y %H:%M:%S", "%m-%d-%y %H:%M"))
#[1] "2016-11-07 14:11:00 UTC" "2016-12-11 02:00:54 UTC"
#[3] NA                        "2016-12-07 22:03:00 UTC"