将格式更改为日期

时间:2020-11-03 16:43:00

标签: scala apache-spark apache-spark-sql

我正在尝试将字符串类型的字段转换为日期。另外,我正在尝试更改日期格式。我没有成功,因为一切都显示为空。

字段:

library(dplyr)
df %>% 
  group_by(State) %>% 
  mutate(n_state = n()) %>% 
  sample_n(ifelse(n >= 30, 30, n))

结果:

+-------------------------+
|financial_statements_date|
+-------------------------+
|                06-sep-12|
|                26-jul-12|
|                02-sep-11|
|                02-dic-09|
|                24-jun-15|
|                19-oct-15|
|                02-sep-13|
|                17-feb-09|
|                24-ago-10|
|                10-ago-16|
|                12-jul-16|
|                27-jul-20|
|                31-dic-02|
|                02-abr-08|
|                17-sep-19|
+-------------------------+

我的代码:

+--------------------+
|gf_company_size_date|
+--------------------+
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
|                null|
+--------------------+

1 个答案:

答案 0 :(得分:0)

您的日期格式不正确,应该有3个M。另外,我认为格式为日,月,年(而不是年,月,日(查看示例数据))。因此,我认为格式应为:

dd-MMM-yy

使用新格式和前3条记录重新运行,现在将它们解析为:

+-------------------------+
|financial_statements_date|
+-------------------------+
|                06-sep-12|
|                26-jul-12|
|                02-sep-11|
+-------------------------+

+--------------------+
|gf_company_size_date|
+--------------------+
|          2012-09-06|
|          2012-07-26|
|          2011-09-02|
+--------------------+

相关: