R lubridate guess_formats重复矢量

时间:2018-05-16 11:34:35

标签: r lubridate

你好,亲爱的知识渊博的R大师和Stackoverflowers,

我正在尝试使用lubridate中的guess_formats在一系列数据集中一致地格式化日期。但是,这会连接该列的两个实例。这是一个最小的例子:

library(lubridate)
x <- c("2014-01-18 00:00:00","2015-03-01 00:00:00","2014-05-05 00:00:00")
y <- as.Date(x, format = guess_formats(x, "Ymd HMS"))

结果:

> x
[1] "2014-01-18 00:00:00" "2015-03-01 00:00:00" "2014-05-05 00:00:00"
> y
[1] "2014-01-18" "2015-03-01" "2014-05-05" "2014-01-18" "2015-03-01"
[6] "2014-05-05"

任何指针都会很棒!

1 个答案:

答案 0 :(得分:1)

问题在于guess_formats

如果您运行guess_formats(x, "Ymd HMS"),则返回不是3种格式,而是6种格式。

             YOmdHMS              YOmdHMS              YOmdHMS               YmdHMS               YmdHMS               YmdHMS 
"%Y-%Om-%d %H:%M:%S" "%Y-%Om-%d %H:%M:%S" "%Y-%Om-%d %H:%M:%S"  "%Y-%m-%d %H:%M:%S"  "%Y-%m-%d %H:%M:%S"  "%Y-%m-%d %H:%M:%S" 

现在您将6种格式传递给as.Date,它将处理这些格式并回收x以匹配。如果您只是将这6种格式粘贴到as.Date中,则可以看到y向量的结果。

as.Date(x, format = c("%Y-%Om-%d %H:%M:%S", "%Y-%Om-%d %H:%M:%S", "%Y-%Om-%d %H:%M:%S" , "%Y-%m-%d %H:%M:%S",  "%Y-%m-%d %H:%M:%S",  "%Y-%m-%d %H:%M:%S") 

[1] "2014-01-18" "2015-03-01" "2014-05-05" "2015-05-05" "2014-01-18" "2015-03-01"

显而易见的解决方案是使用y <- ymd_hms(x),因为你试图猜测这种格式,ymd_hms已经尝试解析这种格式的许多不同版本。