我正在学习tidyverse原理,并想知道是否有更简单/更好的方法来引入包含m / d / Y H:M:S AM / PM格式的日期时间向量的数据。目前我使用read_csv
导入,它以字符格式识别列,然后使用ludridate创建一个新列,使用mdy_hms
来解析datetime列:
> test <- read_csv("data.csv")
Parsed with column specification:
cols(
ActivityMinute = col_character(),
Steps = col_integer()
)
> head(test)
# A tibble: 6 x 2
ActivityMinute Steps
<chr> <int>
1 5/12/2016 12:00:00 AM 0
2 5/12/2016 12:01:00 AM 0
3 5/12/2016 12:02:00 AM 0
4 5/12/2016 12:03:00 AM 0
5 5/12/2016 12:04:00 AM 0
6 5/12/2016 12:05:00 AM 0
> test$datetime <- mdy_hms(test$ActivityMinute)
> head(test)
# A tibble: 6 x 3
ActivityMinute Steps datetime
<chr> <int> <dttm>
1 5/12/2016 12:00:00 AM 0 2016-05-12 00:00:00
2 5/12/2016 12:01:00 AM 0 2016-05-12 00:01:00
3 5/12/2016 12:02:00 AM 0 2016-05-12 00:02:00
4 5/12/2016 12:03:00 AM 0 2016-05-12 00:03:00
5 5/12/2016 12:04:00 AM 0 2016-05-12 00:04:00
6 5/12/2016 12:05:00 AM 0 2016-05-12 00:05:00
有没有更好的方法来做到这一点,也许使用cols()?我尝试将ActivityMinute
指定为col_datetime
,但这不起作用。任何有关更好的代码/流程的提示都表示赞赏
答案 0 :(得分:4)
您必须在col_datetime
电话中设置日期时间格式:
test <-
read_csv(
"data.csv",
col_types = cols(
ActivityMinute = col_datetime("%m/%d/%Y %I:%M:%S %p"),
Steps = col_integer()
)
)