我正在使用Pyspark,并希望在我的数据框中生成随机加密盐作为附加列。我想用它来为我的数据生成哈希值或格式保留加密密码值。 Spark数据帧API中是否有最佳实践来生成加密盐?
答案 0 :(得分:0)
不确定这是否是你要找的,但这就是我做的方式:
import random
from pyspark.sql.functions import udf
from pyspark.sql.types import IntegerType
npart = 50000
def rand(n = npart):
return random.randint(1, n)
salt = udf(rand, IntegerType())
DF.withColumn("salt", salt())