我在R中有以下时间戳列。
name="twitter:amplify:vmap"
我正在对此数据集进行聚类分析。有没有办法将上面的列转换为更可行的数据。与在5分钟内发生的事件一样,应为数据集中的新列分配相同的数值。或者欢迎任何其他方法。
感谢。
答案 0 :(得分:2)
这可能是最简单的方法,只要您可以提供一年,否则年份为0.将cut
中的分钟数更改为任何其他数字。
library(lubridate)
t <- c("03/08-18:30:59.660893", "03/08-18:31:38.243675",
"03/08-18:31:38.243473",
"03/08-18:31:44.635780",
"03/08-18:31:59.779519",
"03/08-18:31:59.795424",
"03/08-18:31:59.798975",
"03/08-18:31:59.803587",
"03/08-18:34:35.570798",
"03/08-18:34:35.569390",
"03/08-18:34:42.408985",
"03/08-18:34:42.405196",
"03/08-18:34:42.559961",
"03/08-18:34:42.558567")
t1 <- paste0('2016/', t)
cut(parse_date_time(t1, '%Y/%m/%d-%H:M:S'), '2 min')