我正在使用PySpark。我有一列是日期数据类型列,另一列是整数数据类型列。
请参见下面的示例:
date subtract
2019-01-08 7
2019-01-04 2
我想创建一个名为“ new_date”的新列,该列从“ date”列中减去“ subtract”列的值。
下面是我想要的输出:
date subtract new_date
2019-01-08 7 2019-01-01
2019-01-04 2 2019-01-02
我尝试了以下代码:
df = df.withColumn('new_date', F.date_sub(df.date, df.subtract))
以下是我得到的错误:TypeError:“列”对象不可调用
答案 0 :(得分:1)
尝试一下:
10-09-2020 10:00 AM