我有一个time
列,时间戳的格式为2018-04-12 06:48:39
。如何在此时间戳中添加Month
列(在这种情况下包含4列)?
答案 0 :(得分:2)
import pyspark.sql.functions as F
df.withColumn('month', F.month('time')).show()
+-------------------+-----+
| time|month|
+-------------------+-----+
|2018-04-12 06:48:39| 4|
+-------------------+-----+