我有一个CSV表,其中包含一个包含不同格式化日期字符串的日期列。我想写一个小函数,试图将这些字符串转换为日期对象。我们的想法是尝试不同的日期格式,直到可以解析日期:
parseDate <- function(date){
formats <- c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S", "%m-%d-%Y-%H:%M:%S")
for(format in formats){
newDate <- strptime(date, format=format)
if(!is.na(newDate)){
return(newDate)
}
}
print(paste0("Invalid input: ", date))
return(NA)
}
column1 <- c("2014-11-14 14:20:16", "24.11.14 9:48", "24.11.14 9:49")
table <- data.frame(column1)
table$column1 = lapply(table$column1, FUN = parseDate)
问题在于我无法找到将此功能应用于列的正确方法。我尝试了lapply
,apply
和by
,其中没有这些函数可以提供所需的输出。你能帮帮我吗?
答案 0 :(得分:2)
你可以尝试parse_date_time
,它可以采用多种“格式”
library(lubridate)
parse_date_time(table$column1, c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S",
"%m-%d-%Y-%H:%M:%S"))
#[1] "2014-11-14 14:20:16 UTC" "2014-11-24 09:48:00 UTC"
#[3] "2014-11-24 09:49:00 UTC"
答案 1 :(得分:2)
也许这个:
> do.call("c", lapply(table$column1, FUN = parseDate))
[1] "2014-11-14 14:20:16 AEDT" "2014-11-24 09:48:00 AEDT"
[3] "2014-11-24 09:49:00 AEDT"