我有一个列向量,并努力对其进行归一化。看起来像这样:
X2015.11.03.15.00.00.1
X2015.11.03.15.00.00.2
X2015.11.03.15.00.00.13
X2015.11.03.15.00.00.14
X2015.11.03.15.00.00.14
X2015.11.03.16.00.00
X2015.11.03.16.00.00
X2015.11.03.17.00.00
我想要得到的是标准化的时间戳:
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 16.00.00
2015.11.03 16.00.00
2015.11.03 17.00.00
到目前为止,我尝试了[Sub和gsub] [1]的各种组合,但没有得到最终结果。
#remove X in Timestamp
x <- gsub("\\X", "", x)
#put space between time date and time
x <- sub("\\s+$", "", gsub('(.{11})', '\\1 ', x))
现在看起来像这样:
2015.11.03. 15.00.00.1
2015.11.03. 15.00.00.2
2015.11.03. 15.00.00.13
2015.11.03. 15.00.00.14
2015.11.03. 15.00.00.14
2015.11.03. 16.00.00
2015.11.03. 16.00.00
2015.11.03. 17.00.00
如何修复其余部分?任何帮助表示赞赏。
答案 0 :(得分:4)
我们可以使用as.POSIXct
使用自定义格式将日期时间转换为日期时间,在我看来,这比使用regex更好,因为输入本身就是日期时间值:
df$V2 <- as.POSIXct(df$V1, format = "X%Y.%m.%d.%H.%M.%S")
输出:
V1 V2
1 X2015.11.03.15.00.00.1 2015-11-03 15:00:00
2 X2015.11.03.15.00.00.2 2015-11-03 15:00:00
3 X2015.11.03.15.00.00.13 2015-11-03 15:00:00
4 X2015.11.03.15.00.00.14 2015-11-03 15:00:00
5 X2015.11.03.15.00.00.14 2015-11-03 15:00:00
6 X2015.11.03.16.00.00 2015-11-03 16:00:00
7 X2015.11.03.16.00.00 2015-11-03 16:00:00
8 X2015.11.03.17.00.00 2015-11-03 17:00:00
数据:
df <- structure(list(V1 = structure(c(1L, 4L, 2L, 3L, 3L, 5L, 5L, 6L
), .Label = c("X2015.11.03.15.00.00.1", "X2015.11.03.15.00.00.13",
"X2015.11.03.15.00.00.14", "X2015.11.03.15.00.00.2", "X2015.11.03.16.00.00",
"X2015.11.03.17.00.00"), class = "factor")), class = "data.frame", row.names = c(NA,
-8L))