标签: pyspark
使用pyspark,是否具有累积正态分布函数?我正在写一个UDF,以降低其潜伏性,但似乎应该引起关注。那就是如果我有一个包含列X, mu, sigma的数据框,我想添加一个列cdf
X, mu, sigma
cdf
scipy.stats.norm.cdf((X-mu)/sigma)