生成随机日期以在Pyspark数据框中填充NULL值

时间:2019-06-27 09:28:18

标签: python pyspark

我有一个带有一些NULL值的pyspark数据帧,我想用给定范围(2015-01-01至2019-01-01)中的随机日期替换它们。

我尝试生成随机数并将其加入,并获得了随机值。但是,所有NULL都将替换为相同的随机值。

data.withColumn('birth_date',when(F.col('birth_date').isNull(),(str(randint(2015,2019))+"-"+str(randint(1,12))+"-"+str(randint(1,31)))).otherwise(F.col('birth_date'))

如何为每个空值填写一个不同的随机日期?

0 个答案:

没有答案