如何在pyspark中创建具有随机浮点值的新列?

时间:2018-12-04 08:31:15

标签: apache-spark pyspark apache-spark-sql

我尝试使用此代码

from pyspark.sql.functions import rand,when
df1 = df.withColumn('isVal', when(rand()0.5,1).otherwise(0.6))

但是此代码仅生成整数,我想生成介于1.5到2.5之间的整数,我该如何在pyspark中做到这一点?

2 个答案:

答案 0 :(得分:0)

from pyspark.sql.functions import rand
df1 = df.withColumn('isVal', 1.5+rand())

答案 1 :(得分:0)

某些数学-1.5+rand()将介于[1.5,2.5]之间,因为maximum的{​​{1}}值可以是rand(),因此1和{{1 }}是1.5+1=2.5,所以minimum

0