关于时间戳的pyspark数据帧的问题

时间:2019-11-15 09:52:39

标签: python dataframe apache-spark pyspark

我有一个数据框,其中一列是时间戳。

enter image description here

如何从此列中以以下格式创建另一个数据框

enter image description here

我可以在这里得到一些帮助吗?

1 个答案:

答案 0 :(得分:0)

假设您的时间戳列名称是时间:

from pyspark.sql.functions import * 
df2 = df1.withColumn('year',year('time')).withColumn('quarter',quarter('time')).withColumn('weekOfTheYear',weekofyear('time')).withColumn('dayOfTheWeek', dayofweek('time')).withColumn('dayofmonth',dayofmonth('time'))