从pyspark agg函数到int

时间:2018-12-09 04:55:25

标签: pyspark

我正在按pyspark上的条件对行进行计数

df.agg(count(when((col("my_value")==0),True))).show()

它按我的预期工作。然后,如何提取表中显示的值以存储到Python变量中?

1 个答案:

答案 0 :(得分:0)

如果您只想计算真实数字(ceros),则最好这样做:

from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]

如您所见,无需将ceros更改为True即可对其计数。