我正在按pyspark上的条件对行进行计数
df.agg(count(when((col("my_value")==0),True))).show()
它按我的预期工作。然后,如何提取表中显示的值以存储到Python变量中?
答案 0 :(得分:0)
如果您只想计算真实数字(ceros),则最好这样做:
from pyspark.sql import functions as F
pythonVariable = df.where(F.col('my_value') == 0).collect[0][0]
如您所见,无需将ceros更改为True即可对其计数。