为什么PySpark Groupby花这么长时间?

时间:2020-08-16 16:13:40

标签: python pyspark apache-spark-sql

SparkVersion 3.0

我尝试了各种方法来对表进行分组,计算不同的值或过滤数据。

为什么执行groupby并计数需要这么长时间?

SiteName = df['20160201'].select('SiteName','Temperature')
SiteName_Group = SiteName.groupBy("SiteName")
SiteName_Group.count()

0 个答案:

没有答案