Pyspark:如何将10天添加到现有日期列

时间:2018-06-05 15:03:43

标签: date pyspark add days

我在Pyspark中有一个数据框,其中包含一个名为“report_date”的日期列。

我想创建一个名为“report_date_10”的新列,该列已添加到原始report_date列中10天。

以下是我尝试的代码:

df_dc["report_date_10"] = df_dc["report_date"] + timedelta(days=10)

这是我得到的错误:

AttributeError:'datetime.timedelta'对象没有属性'_get_object_id'

帮助! thx

1 个答案:

答案 0 :(得分:4)

您似乎使用class Tree: def __init__(self): self.list_of_nodes=[] def inser_node (self, node: Tree): self.list_of_nodes.append(node) 语法添加列;对于spark,您需要使用pandas添加新列;要添加日期,内置withColumn函数:

date_add