我有一个带有一些NULL值的pyspark数据帧,我想用给定范围(2015-01-01至2019-01-01)中的随机日期替换它们。
我尝试生成随机数并将其加入,并获得了随机值。但是,所有NULL都将替换为相同的随机值。
data.withColumn('birth_date',when(F.col('birth_date').isNull(),(str(randint(2015,2019))+"-"+str(randint(1,12))+"-"+str(randint(1,31)))).otherwise(F.col('birth_date'))
如何为每个空值填写一个不同的随机日期?