pyspark将列的最大值保存到参数中?

时间:2018-10-15 03:52:37

标签: pyspark

在pyspark中,如果我使用以下代码来计算最大值,则将得到类似“ Row(max(age)= 5)]”的结果。但是,有什么方法可以将输出值5保存到max_age这样的参数中?

print(x.agg({"age": "max"}).collect())

1 个答案:

答案 0 :(得分:1)

是的,可以。您只需要提取值即可。

max_age = x.agg({"age": "max"}).collect()[0]['max(age)']