将时间数据转换为本地时间,使用向量作为R中的tz

时间:2015-12-18 14:41:30

标签: r optimization timezone

事实上,我知道如何使用for循环执行此操作,如以下帖子中所述。

Converting to Local Time in R - Vector of Timezones

但是,如果列表太长(500,000条记录),则计算将永久进行。有一个更好的方法吗?

我的数据(df)是字符格式。它看起来像这样:

       raw_date             timezoneID
2012-07-01 01:41:48 America/Montreal
2012-07-01 01:41:55 America/Edmonton
2012-07-01 08:26:07 America/Montreal
2012-07-01 09:26:08  America/Toronto
2012-07-01 10:29:05  America/Toronto
2012-07-01 10:39:20  America/Toronto

这就是我的所作所为:

tmp_time <- data.frame(EST_date = as.POSIXct(df$raw_date,  tz="EST"), TZID = df$timezoneID)
tmp_time$TZID <- as.character(tmp_time$TZID)

local_time <- vector()
for (i in (1:nrow(tmp_time))){
    local_time[i] <- (format(tmp_time$EST_date[i], tz=tmp_time$TZID[i],usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
}
local_time
# [1] "2012-07-01 02:41:48 EDT" "2012-07-01 00:41:55 MDT"
# [3] "2012-07-01 09:26:07 EDT" "2012-07-01 10:26:08 EDT"
# [5] "2012-07-01 11:29:05 EDT" "2012-07-01 11:39:20 EDT"

正如我所说的,上述解决方案有效,但速度非常慢,而且我的计算机几乎挂起了500,000条记录。关于如何加快速度的任何线索?

1 个答案:

答案 0 :(得分:2)

library(dplyr)

tmp_time %>% group_by(TZID) %>%
  mutate(tm=format(EST_date, tz=unique(TZID),
                   usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
# Source: local data frame [6 x 3]
# Groups: TZID [3]

#              EST_date             TZID                      tm
#                (time)            (chr)                   (chr)
# 1 2012-07-01 01:41:48 America/Montreal 2012-07-01 02:41:48 EDT
# 2 2012-07-01 01:41:55 America/Edmonton 2012-07-01 00:41:55 MDT
# 3 2012-07-01 08:26:07 America/Montreal 2012-07-01 09:26:07 EDT
# 4 2012-07-01 09:26:08  America/Toronto 2012-07-01 10:26:08 EDT
# 5 2012-07-01 10:29:05  America/Toronto 2012-07-01 11:29:05 EDT
# 6 2012-07-01 10:39:20  America/Toronto 2012-07-01 11:39:20 EDT