我在Pyspark中有一个数据框,其中包含一个名为“report_date”的日期列。
我想创建一个名为“report_date_10”的新列,该列已添加到原始report_date列中10天。
以下是我尝试的代码:
df_dc["report_date_10"] = df_dc["report_date"] + timedelta(days=10)
这是我得到的错误:
AttributeError:'datetime.timedelta'对象没有属性'_get_object_id'
帮助! thx
答案 0 :(得分:4)
您似乎使用class Tree:
def __init__(self):
self.list_of_nodes=[]
def inser_node (self, node: Tree):
self.list_of_nodes.append(node)
语法添加列;对于spark,您需要使用pandas
添加新列;要添加日期,内置withColumn
函数:
date_add