我一直在尝试查看数据框,提取POSIXct列的日期组件与某个值匹配的所有行。我遇到了以下令我困惑的问题:as.Date(as.POSIXct(...))
并非总是如此返回正确的日期。
> dt <- as.POSIXct('2012-08-06 09:35:23')
[1] "2012-08-06 09:35:23 EST"
> as.Date(dt)
[1] "2012-08-05"
为什么'2012-08- 06 09:35:23'的日期等于'2012-08- 05 ?
我怀疑这与使用的不同时区有关,所以注意到dt
的时区是'EST',我把它给了as.Date
::
> as.Date(as.POSIXct('2012-08-06 09:35:23'), tz='EST')
[1] "2012-08-05"
但它仍然会在2012-08-05返回。
这是为什么?如何查找2012-08-06日期数据框中的所有日期时间? (因为subset(my.df, as.character(as.Date(datetime), tz='EST') == '2012-08-06')
不会返回日期时间为dt
的行,即使这确实发生在2012-08-06日期...)?
添加了细节:Linux 64bit(虽然可以在32位上重现),可以在R 3.0.1&amp; 3.0.0,我目前是AEST(澳大利亚东部标准时间)
答案 0 :(得分:13)
时区的文档也让我感到困惑。在某些情况下,EST可能不是明确的,实际上可能是指澳大利亚的tz。试试“EST5EDT”或“America / New_York”。
在这种情况下,它也可能与你未说明的操作系统处理'tz'参数的方式有所不同,因为我得到了“2012-08-06”。 (我现在在PDT US tz,虽然我不确定这应该重要。)改变哪个函数得到tz参数可以澄清(或不):
> as.Date(as.POSIXct('2012-08-06 19:35:23', tz='EST'))
[1] "2012-08-07"
> as.Date(as.POSIXct('2012-08-06 17:35:23', tz='EST'))
[1] "2012-08-06"
> as.Date(as.POSIXct('2012-08-06 21:35:23'), tz='EST')
[1] "2012-08-06"
> as.Date(as.POSIXct('2012-08-06 22:35:23'), tz='EST')
[1] "2012-08-07"
如果省略as.POSIXct
的tz,则假设为UTC。
这些是Ozzie TZ的明确名称(至少在我的Mac上):
tzfile <- "/usr/share/zoneinfo/zone.tab"
tzones <- read.delim(tzfile, row.names = NULL, header = FALSE,
col.names = c("country", "coords", "name", "comments"),
as.is = TRUE, fill = TRUE, comment.char = "#")
grep("^Aus", tzones$name, value=TRUE)
[1] "Australia/Lord_Howe" "Australia/Hobart"
[3] "Australia/Currie" "Australia/Melbourne"
[5] "Australia/Sydney" "Australia/Broken_Hill"
[7] "Australia/Brisbane" "Australia/Lindeman"
[9] "Australia/Adelaide" "Australia/Darwin"
[11] "Australia/Perth" "Australia/Eucla"
答案 1 :(得分:9)
澳大利亚同事(布里斯班位置,Win7 Enterprise 64位,R3.0.1):
我可以复制你的问题:
> dt <- as.POSIXct('2012-08-06 09:35:23')
> dt
[1] "2012-08-06 09:35:23 EST"
> as.Date(dt)
[1] "2012-08-05"
由于as.Date
中列出的UTC
默认为?as.Date
(GMT):
## S3 method for class 'POSIXct'
as.Date(x, tz = "UTC", ...)
将POSIXct
表示强制转换为UTC然后按预期工作:
> dt <- as.POSIXct('2012-08-06 09:35:23',tz="UTC")
> as.Date(dt)
[1] "2012-08-06"
或者,将它们与我的本地tz
匹配也可以正常工作:
> dt <- as.POSIXct('2012-08-06 09:35:23',tz="Australia/Brisbane")
> as.Date(dt,tz="Australia/Brisbane")
[1] "2012-08-06"
编辑:对EST
规范的歧义似乎对我来说是一个问题:
默认使用as.POSIXct
> dt.def <- as.POSIXct("2012-01-01 22:00:00")
> dt.def
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.def)
[1] 1325419200
>
不明确EST
- 应与默认
> dt.est <- as.POSIXct("2012-01-01 22:00:00",tz="EST")
> dt.est
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.est)
[1] 1325473200
>
明确布里斯班,澳大利亚时区
> dt.bris <- as.POSIXct("2012-01-01 22:00:00",tz="Australia/Brisbane")
> dt.bris
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.bris )
[1] 1325419200
>
差异
> dt.est - dt.def
Time difference of 15 hours
> dt.est - dt.bris
Time difference of 15 hours
> dt.bris - dt.def
Time difference of 0 secs