POSIXct使用不同的时区进行数字化

时间:2013-08-09 21:35:13

标签: r posixct

我想我不能理解POSIXct是如何工作的。据我所知,它是纪元以来的秒数,其中纪元是1970-01-01 GMT的标准时间。

我在PST中有两个POSIXct时间,一个在PST中,绝对时间相同。然而,当我将它们转换为数值时,结果是不同的......有人能指出我做错了吗?

> pst = as.POSIXct('2011-01-10 06:45:00', tz = 'PST')
> est = as.POSIXct('2011-01-10 09:45:00', tz = 'EST')
> as.numeric(pst)
 [1] 1294641900
> as.numeric(est)
 [1] 1294670700

这是我的会话信息:

> sessionInfo()
R version 2.13.0 (2011-04-13)
Platform: x86_64-unknown-linux-gnu (64-bit)

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C               LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8     LC_MONETARY=C              LC_MESSAGES=en_US.UTF-8    LC_PAPER=en_US.UTF-8       LC_NAME=C\
                  LC_ADDRESS=C
[10] LC_TELEPHONE=C             LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C

attached base packages:
[1] grid      stats     graphics  grDevices utils     datasets  methods   base

other attached packages:
 [1] RSQLite_0.9-4      snow_0.3-8         RMySQL_0.8-0       DBI_0.2-5          gtools_2.6.2       reshape2_1.1       ggplot2_0.8.9      proto_0.3-9.2      reshape_0.8.4      fTrading_2100.76   fBasics_\
2110.79    MASS_7.3-12
[13] timeSeries_2130.92 timeDate_2131.00   plyr_1.7.1

loaded via a namespace (and not attached):
[1] stringr_0.4  tools_2.13.0

2 个答案:

答案 0 :(得分:5)

时区名称并不像您希望的那样简单。有关背景信息,请参阅http://en.wikipedia.org/wiki/Tz_database;有关所用名称的列表,请参阅http://en.wikipedia.org/wiki/List_of_tz_database_time_zones。到目前为止,最好的方法是使用tz = 'country / city'表示法并明确设置本地系统的时区。

所以,这是一个使用两种不同方法对时区进行编码的脚本:

Sys.setenv(TZ='GMT')
pst.abr <- as.POSIXct('2011-01-10 06:45:00', tz = 'PST')
est.abr <- as.POSIXct('2011-01-10 09:45:00', tz = 'EST')
pst.country.city <- as.POSIXct('2011-01-10 06:45:00', tz = 'America/Los_Angeles')
est.country.city <- as.POSIXct('2011-01-10 09:45:00', tz = 'America/New_York')

如果我们看看我们想要的PST的POSIXct值,我们会发现它们实际上有两个不同的值。从缩写(tz ='PST')开始,您可以得到:

> pst.abr
[1] "2011-01-10 06:45:00 UTC"
> as.numeric(pst.abr)
[1] 1294641900

您看到我们使用tz='PST'定义的数据实际上并不在PST时区,而是继承了系统的时区。

将此与我们使用country \ city定义的数据进行比较:

> as.numeric(pst.country.city)
[1] 1294670700
> pst.country.city
[1] "2011-01-10 06:45:00 PST"

因此,只有我们使用国家/城市信息明确编码的数据才有正确的时区信息。

答案 1 :(得分:3)

这是因为tz="PST"意味着你认为它在你的系统上所做的事情。在Linux上,您可能会在/usr/share/zoneinfo/zone.tab中找到可用全名列表。对于我使用tz='America/Los_Angeles'的Linux发行版。

如果您输入?Sys.timezone,您会找到更多信息。