事实上,我知道如何使用for循环执行此操作,如以下帖子中所述。
Converting to Local Time in R - Vector of Timezones
但是,如果列表太长(500,000条记录),则计算将永久进行。有一个更好的方法吗?
我的数据(df)是字符格式。它看起来像这样:
raw_date timezoneID
2012-07-01 01:41:48 America/Montreal
2012-07-01 01:41:55 America/Edmonton
2012-07-01 08:26:07 America/Montreal
2012-07-01 09:26:08 America/Toronto
2012-07-01 10:29:05 America/Toronto
2012-07-01 10:39:20 America/Toronto
这就是我的所作所为:
tmp_time <- data.frame(EST_date = as.POSIXct(df$raw_date, tz="EST"), TZID = df$timezoneID)
tmp_time$TZID <- as.character(tmp_time$TZID)
local_time <- vector()
for (i in (1:nrow(tmp_time))){
local_time[i] <- (format(tmp_time$EST_date[i], tz=tmp_time$TZID[i],usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
}
local_time
# [1] "2012-07-01 02:41:48 EDT" "2012-07-01 00:41:55 MDT"
# [3] "2012-07-01 09:26:07 EDT" "2012-07-01 10:26:08 EDT"
# [5] "2012-07-01 11:29:05 EDT" "2012-07-01 11:39:20 EDT"
正如我所说的,上述解决方案有效,但速度非常慢,而且我的计算机几乎挂起了500,000条记录。关于如何加快速度的任何线索?
答案 0 :(得分:2)
library(dplyr)
tmp_time %>% group_by(TZID) %>%
mutate(tm=format(EST_date, tz=unique(TZID),
usetz = TRUE, "%Y-%m-%d %H:%M:%S"))
# Source: local data frame [6 x 3]
# Groups: TZID [3]
# EST_date TZID tm
# (time) (chr) (chr)
# 1 2012-07-01 01:41:48 America/Montreal 2012-07-01 02:41:48 EDT
# 2 2012-07-01 01:41:55 America/Edmonton 2012-07-01 00:41:55 MDT
# 3 2012-07-01 08:26:07 America/Montreal 2012-07-01 09:26:07 EDT
# 4 2012-07-01 09:26:08 America/Toronto 2012-07-01 10:26:08 EDT
# 5 2012-07-01 10:29:05 America/Toronto 2012-07-01 11:29:05 EDT
# 6 2012-07-01 10:39:20 America/Toronto 2012-07-01 11:39:20 EDT