删除列向量中的数字和点

时间:2019-03-12 14:32:16

标签: r

我有一个列向量,并努力对其进行归一化。看起来像这样:

X2015.11.03.15.00.00.1
X2015.11.03.15.00.00.2
X2015.11.03.15.00.00.13
X2015.11.03.15.00.00.14
X2015.11.03.15.00.00.14
X2015.11.03.16.00.00
X2015.11.03.16.00.00
X2015.11.03.17.00.00 

我想要得到的是标准化的时间戳:

2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 15.00.00
2015.11.03 16.00.00
2015.11.03 16.00.00
2015.11.03 17.00.00

到目前为止,我尝试了[Sub和gsub] [1]的各种组合,但没有得到最终结果。

#remove X in Timestamp
x <- gsub("\\X", "", x)
#put space between time date and time
x <- sub("\\s+$", "", gsub('(.{11})', '\\1 ', x))

现在看起来像这样:

2015.11.03. 15.00.00.1
2015.11.03. 15.00.00.2
2015.11.03. 15.00.00.13
2015.11.03. 15.00.00.14
2015.11.03. 15.00.00.14
2015.11.03. 16.00.00
2015.11.03. 16.00.00
2015.11.03. 17.00.00

如何修复其余部分?任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:4)

我们可以使用as.POSIXct使用自定义格式将日期时间转换为日期时间,在我看来,这比使用regex更好,因为输入本身就是日期时间值:

df$V2 <- as.POSIXct(df$V1, format = "X%Y.%m.%d.%H.%M.%S")

输出:

                       V1                  V2
1  X2015.11.03.15.00.00.1 2015-11-03 15:00:00
2  X2015.11.03.15.00.00.2 2015-11-03 15:00:00
3 X2015.11.03.15.00.00.13 2015-11-03 15:00:00
4 X2015.11.03.15.00.00.14 2015-11-03 15:00:00
5 X2015.11.03.15.00.00.14 2015-11-03 15:00:00
6    X2015.11.03.16.00.00 2015-11-03 16:00:00
7    X2015.11.03.16.00.00 2015-11-03 16:00:00
8    X2015.11.03.17.00.00 2015-11-03 17:00:00

数据:

df <- structure(list(V1 = structure(c(1L, 4L, 2L, 3L, 3L, 5L, 5L, 6L
), .Label = c("X2015.11.03.15.00.00.1", "X2015.11.03.15.00.00.13", 
"X2015.11.03.15.00.00.14", "X2015.11.03.15.00.00.2", "X2015.11.03.16.00.00", 
"X2015.11.03.17.00.00"), class = "factor")), class = "data.frame", row.names = c(NA, 
-8L))