根据条件在pyspark中创建列

时间:2018-08-21 13:23:17

标签: pyspark pyspark-sql

我目前正在使用Spark数据帧,该数据帧有7列,其中一列是date。在我的情况下,日期列表示为季度,即2017Q1、2017Q2、2017Q3

如何创建如下两个新列

Date_String 
Replace 2017Q1 with string "January - March 2017" and
replace 2017Q2 with string "April -June 2017 

我尝试了以下命令

df= df.withColumn("Date_String",where(col("quarter_date") == "2017Q4"),lit('October - December 2017'))

有人可以在上面帮助我

0 个答案:

没有答案