如何获取几列的最大值并在数据框中创建新列

时间:2020-02-27 10:31:25

标签: dataframe pyspark pyspark-dataframes

我有一个如下所示的数据框:

enter image description here

我需要遍历item_1到item_3,然后获取该行的最大值并创建一个名为item的新列。

输出应如下所示:

enter image description here

我们在这里应该使用什么功能?

1 个答案:

答案 0 :(得分:1)

您要寻找的功能称为greatest

df.withColumn(
    "item",
    greatest("item_1","item_2","item_3")
)