我有以下数据框,数据集已经从数据库表导入,created_at列有字符类型:
sale_id created_at
1 2016-05-28T05:53:31.042Z
2 2016-05-30T12:50:58.184Z
3 2016-05-23T10:22:18.858Z
4 2016-05-27T09:20:15.158Z
5 2016-05-21T08:30:17.337Z
6 2016-05-28T07:41:14.361Z
如何从created_at列中仅提取小时和分钟,最好使用基本r库?我需要稍后将小时和分钟粘贴在一起并将其作为新列。
答案 0 :(得分:2)
我们可以使用lubridate
中的便捷功能将character
列转换为DateTime
,并使用format
library(lubridate)
v1 <- ymd_hms("2016-05-28T05:53:31.042Z")
format(v1, "%H:%M")
#[1] "05:53"
或仅使用base R
format(as.POSIXct("2016-05-28T05:53:31.042z", format = "%Y-%m-%dT%H:%M:%S"), "%H:%M")
#[1] "05:53"
其他选项包括gsub
gsub(".*T|:\\d+\\..*", "", "2016-05-28T05:53:31.042z")
#[1] "05:53"
答案 1 :(得分:1)
仅使用基本R库:
format(as.POSIXct("2016-05-28T05:53:31.042z", format = "%Y-%m-%dT%H:%M:%S"), "%H:%M")
5时31
似乎是UTC格式。有关解析该格式的更多详细信息,请参阅this。
让我以Sys.Date()
为例展示它:
format(as.POSIXlt(Sys.time(), "America/New_York"), "%H:%M")
8点15
使用无限更好的lubridate
库:
require(lubridate)
minute(ymd_hms("2016-05-28T05:53:31.042Z"))
53
second(ymd_hms("2016-05-28T05:53:31.042Z"))
31.042