功能最大的是倒数吗? 什么能得到多列的最小值?
如果没有,除了使用udf函数之外,你还知道找到它的其他方法吗?
谢谢!
答案 0 :(得分:2)
pyspark.sql.functions.least(*cols)
返回列名列表的最小值,跳过空值。此功能至少需要2个参数。如果所有参数都为空,它将返回null。
>>> df = spark.createDataFrame([(1, 4, 3)], ['a', 'b', 'c']) >>> df.select(least(df.a, df.b, df.c).alias("least")).collect() [Row(least=1)]