我有一个数据框,其中一列是时间戳。
如何从此列中以以下格式创建另一个数据框
我可以在这里得到一些帮助吗?
答案 0 :(得分:0)
假设您的时间戳列名称是时间:
from pyspark.sql.functions import *
df2 = df1.withColumn('year',year('time')).withColumn('quarter',quarter('time')).withColumn('weekOfTheYear',weekofyear('time')).withColumn('dayOfTheWeek', dayofweek('time')).withColumn('dayofmonth',dayofmonth('time'))