我在这里提出了一些问题,询问如何将字符向量转换为datetime类。我经常看到2种方法,strptime和as.POSIXct / as.POSIXlt方法。我查看了2个函数,但不清楚区别是什么。
function (x, format, tz = "")
{
y <- .Internal(strptime(as.character(x), format, tz))
names(y$year) <- names(x)
y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>
function (x, tz = "", ...)
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>
function (x, tz = "", ...)
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>
执行微基准测试以查看是否存在性能差异:
library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)
Unit: milliseconds
expr min lq median uq max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2 strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422
strptime似乎稍快一些。什么赋予了什么?为什么会有2个相似的功能或者我之间是否存在差异?
答案 0 :(得分:141)
嗯,这些功能做了不同的事情。
首先,日期/时间有两个内部实现:POSIXct
,它存储自UNIX纪元以来的秒数(+一些其他数据),以及POSIXlt
,它存储一天,一个月的列表,年,小时,分钟,秒等。
strptime
是一种将字符向量(各种格式)直接转换为POSIXlt
格式的函数。
as.POSIXlt
将各种数据类型转换为POSIXlt
。它试图变得聪明并做出明智的事情 - 在角色的情况下,它充当strptime
的包装。
as.POSIXct
将各种数据类型转换为POSIXct
。它也试图变得聪明并且做出明智的事情 - 在角色的情况下,它首先运行strptime
,然后从POSIXlt
转换为POSIXct
。
strptime
更快是有意义的,因为strptime
只处理字符输入,而其他人尝试从输入类型确定使用哪种方法。它也应该更安全一点,因为交付意外数据只会产生错误,而不是试图做出可能不是你想要的智能事物。
答案 1 :(得分:18)
有两种POSIXt类型,POSIXct和POSIXlt。 &#34;克拉&#34;可以代表日历时间,它存储自原点以来的秒数。 &#34; lt&#34;或当地时间将日期保留为时间属性列表(例如&#34;小时&#34;和&#34; mon&#34;)。 试试这些例子:
date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")
date=c("26/10/2016")
time=c("19:51:30")
day<-paste(date,"T", time)
day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time1
day.time1$year
day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")
day.time2
day.time2$year