R中的tbl_spark中有多种日期格式。我想将所有日期格式更改为一种格式(dd-mm-yyyy)

时间:2020-05-14 08:50:00

标签: r sparklyr

library(sparklyr)
sc <- spark_connect(master = "local")

date1 <- data.frame(DATE1 =c ("12-01-2020","2020-12-24",
  "14-May-2020","19/3/2020 14:32:15",
  "2020-09-08","05/05/2020"),
  NAME1 = c("A","B","C","D","E","F"))
tbl <- copy_to(sc, date1)

最终结果日期应为“ dd-mmm-yyyy”格式。

尝试过

 lubridate::parse_date_time(tbl %>% select(DATE1) , c('dmY', 'Ymd', 'dmYT'))

[1]不适用不适用 警告信息: 所有格式均无法解析。找不到格式。

1 个答案:

答案 0 :(得分:1)

这在R中有效,可以检查在sparklyr中是否可用吗?

as.Date(lubridate::parse_date_time(date1$DATE1, c('dmY', 'Ymd', 'dmYT')))
#[1] "2020-01-12" "2020-12-24" "2020-05-14" "2020-03-19" "2020-09-08" "2020-05-05"