Spark数据帧字符串到月份

时间:2017-10-27 21:06:59

标签: scala apache-spark dataframe apache-spark-sql

我有一个数据框,其中一列orddate为字符串,我想从orddate中提取月份,在新df上创建一个名为month的新列。

|orddate|
|12/1/10 9:37| 
|20/3/10 10:37| 
|09/8/14 4:56| 
|30/12/11 12:13| 
|24/5/10 7:27|

转换为

|orddate| month |
|12/1/10 9:37| january|
|20/3/10 10:37| march |
|09/8/14 4:56| august |
|30/12/11 12:13| december |
|24/5/10 7:27| may |

1 个答案:

答案 0 :(得分:2)

1)使用格式为unix_timestamp的{​​{1}}将列转换为时间戳; 2)使用格式为dd/MM/yy hh:mm的{​​{1}}将时间戳转换为from_unixtime;

您可以详细了解格式here

MMMMM