从r中的字符列中提取小时和分钟

时间:2016-07-04 12:04:59

标签: r datetime dataframe data-analysis posixlt

我有以下数据框,数据集已经从数据库表导入,created_at列有字符类型:

sale_id      created_at
1               2016-05-28T05:53:31.042Z
2               2016-05-30T12:50:58.184Z
3               2016-05-23T10:22:18.858Z
4               2016-05-27T09:20:15.158Z
5               2016-05-21T08:30:17.337Z
6               2016-05-28T07:41:14.361Z

如何从created_at列中仅提取小时和分钟,最好使用基本r库?我需要稍后将小时和分钟粘贴在一起并将其作为新列。

2 个答案:

答案 0 :(得分:2)

我们可以使用lubridate中的便捷功能将character列转换为DateTime,并使用format

提取小时和分钟
library(lubridate)
v1 <- ymd_hms("2016-05-28T05:53:31.042Z")
format(v1, "%H:%M")
#[1] "05:53"

或仅使用base R

format(as.POSIXct("2016-05-28T05:53:31.042z", format = "%Y-%m-%dT%H:%M:%S"),  "%H:%M")
#[1] "05:53"

其他选项包括gsub

gsub(".*T|:\\d+\\..*", "", "2016-05-28T05:53:31.042z")
#[1] "05:53"

答案 1 :(得分:1)

仅使用基本R库:

format(as.POSIXct("2016-05-28T05:53:31.042z", format = "%Y-%m-%dT%H:%M:%S"),  "%H:%M")
  

5时31

似乎是UTC格式。有关解析该格式的更多详细信息,请参阅this

让我以Sys.Date()为例展示它:

format(as.POSIXlt(Sys.time(), "America/New_York"), "%H:%M")
  

8点15

使用无限更好的lubridate库:

require(lubridate)
minute(ymd_hms("2016-05-28T05:53:31.042Z"))
  

53

second(ymd_hms("2016-05-28T05:53:31.042Z"))
  

31.042