标签: dataframe pyspark pyspark-dataframes
我有一个如下所示的数据框:
我需要遍历item_1到item_3,然后获取该行的最大值并创建一个名为item的新列。
输出应如下所示:
我们在这里应该使用什么功能?
答案 0 :(得分:1)
您要寻找的功能称为greatest
greatest
df.withColumn( "item", greatest("item_1","item_2","item_3") )