R:转换数据表的日期列

时间:2015-02-21 14:16:34

标签: r

我有一个CSV表,其中包含一个包含不同格式化日期字符串的日期列。我想写一个小函数,试图将这些字符串转换为日期对象。我们的想法是尝试不同的日期格式,直到可以解析日期:

parseDate <- function(date){
  formats <- c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S", "%m-%d-%Y-%H:%M:%S")

  for(format in formats){
    newDate <- strptime(date, format=format)
    if(!is.na(newDate)){
      return(newDate)
    }
  }

  print(paste0("Invalid input: ", date))
  return(NA)
}

column1 <- c("2014-11-14 14:20:16", "24.11.14 9:48", "24.11.14 9:49")
table <- data.frame(column1)

table$column1 = lapply(table$column1, FUN = parseDate)

问题在于我无法找到将此功能应用于列的正确方法。我尝试了lapplyapplyby,其中没有这些函数可以提供所需的输出。你能帮帮我吗?

2 个答案:

答案 0 :(得分:2)

你可以尝试parse_date_time,它可以采用多种“格式”

library(lubridate)
parse_date_time(table$column1, c("%d.%m.%y %H:%M", "%Y-%m-%d %H:%M:%S", 
           "%m-%d-%Y-%H:%M:%S"))
#[1] "2014-11-14 14:20:16 UTC" "2014-11-24 09:48:00 UTC"
#[3] "2014-11-24 09:49:00 UTC"

答案 1 :(得分:2)

也许这个:

> do.call("c", lapply(table$column1, FUN = parseDate))
[1] "2014-11-14 14:20:16 AEDT" "2014-11-24 09:48:00 AEDT"
[3] "2014-11-24 09:49:00 AEDT"