as.Date(as.POSIXct())给出错误的日期?

时间:2013-06-13 23:25:50

标签: r datetime timezone

我一直在尝试查看数据框,提取POSIXct列的日期组件与某个值匹配的所有行。我遇到了以下令我困惑的问题:as.Date(as.POSIXct(...))并非总是如此返回正确的日期。

> dt <- as.POSIXct('2012-08-06 09:35:23')
[1] "2012-08-06 09:35:23 EST"
> as.Date(dt)
[1] "2012-08-05"

为什么'2012-08- 06 09:35:23'的日期等于'2012-08- 05

我怀疑这与使用的不同时区有关,所以注意到dt的时区是'EST',我把它给了as.Date ::

> as.Date(as.POSIXct('2012-08-06 09:35:23'), tz='EST')
[1] "2012-08-05"

但它仍然会在2012-08-05返回。

这是为什么?如何查找2012-08-06日期数据框中的所有日期时间? (因为subset(my.df, as.character(as.Date(datetime), tz='EST') == '2012-08-06')不会返回日期时间为dt的行,即使这确实发生在2012-08-06日期...)?

添加了细节:Linux 64bit(虽然可以在32位上重现),可以在R 3.0.1&amp; 3.0.0,我目前是AEST(澳大利亚东部标准时间)

2 个答案:

答案 0 :(得分:13)

时区的文档也让我感到困惑。在某些情况下,EST可能不是明确的,实际上可能是指澳大利亚的tz。试试“EST5EDT”或“America / New_York”。

在这种情况下,它也可能与你未说明的操作系统处理'tz'参数的方式有所不同,因为我得到了“2012-08-06”。 (我现在在PDT US tz,虽然我不确定这应该重要。)改变哪个函数得到tz参数可以澄清(或不):

> as.Date(as.POSIXct('2012-08-06 19:35:23', tz='EST'))
[1] "2012-08-07"
> as.Date(as.POSIXct('2012-08-06 17:35:23', tz='EST'))
[1] "2012-08-06"


> as.Date(as.POSIXct('2012-08-06 21:35:23'), tz='EST')
[1] "2012-08-06"
> as.Date(as.POSIXct('2012-08-06 22:35:23'), tz='EST')
[1] "2012-08-07"

如果省略as.POSIXct的tz,则假设为UTC。

这些是Ozzie TZ的明确名称(至少在我的Mac上):

tzfile <- "/usr/share/zoneinfo/zone.tab"
tzones <- read.delim(tzfile, row.names = NULL, header = FALSE,
    col.names = c("country", "coords", "name", "comments"),
    as.is = TRUE, fill = TRUE, comment.char = "#")
grep("^Aus", tzones$name, value=TRUE)
 [1] "Australia/Lord_Howe"   "Australia/Hobart"     
 [3] "Australia/Currie"      "Australia/Melbourne"  
 [5] "Australia/Sydney"      "Australia/Broken_Hill"
 [7] "Australia/Brisbane"    "Australia/Lindeman"   
 [9] "Australia/Adelaide"    "Australia/Darwin"     
[11] "Australia/Perth"       "Australia/Eucla" 

答案 1 :(得分:9)

澳大利亚同事(布里斯班位置,Win7 Enterprise 64位,R3.0.1):

我可以复制你的问题:

> dt <- as.POSIXct('2012-08-06 09:35:23')
> dt
[1] "2012-08-06 09:35:23 EST"
> as.Date(dt)
[1] "2012-08-05"

由于as.Date中列出的UTC默认为?as.Date(GMT):

## S3 method for class 'POSIXct'
as.Date(x, tz = "UTC", ...) 

POSIXct表示强制转换为UTC然后按预期工作:

> dt <- as.POSIXct('2012-08-06 09:35:23',tz="UTC")
> as.Date(dt)
[1] "2012-08-06"

或者,将它们与我的本地tz匹配也可以正常工作:

> dt <- as.POSIXct('2012-08-06 09:35:23',tz="Australia/Brisbane")
> as.Date(dt,tz="Australia/Brisbane")
[1] "2012-08-06"

编辑:对EST规范的歧义似乎对我来说是一个问题:

默认使用as.POSIXct

> dt.def <- as.POSIXct("2012-01-01 22:00:00")
> dt.def
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.def)
[1] 1325419200
> 

不明确EST - 应与默认

相同
> dt.est <- as.POSIXct("2012-01-01 22:00:00",tz="EST")
> dt.est
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.est)
[1] 1325473200
> 

明确布里斯班,澳大利亚时区

> dt.bris <- as.POSIXct("2012-01-01 22:00:00",tz="Australia/Brisbane")
> dt.bris
[1] "2012-01-01 22:00:00 EST"
> as.numeric(dt.bris )
[1] 1325419200
> 

差异

> dt.est - dt.def
Time difference of 15 hours
> dt.est - dt.bris
Time difference of 15 hours
> dt.bris - dt.def
Time difference of 0 secs