应用错误收集

为什么PySpark Groupby花这么长时间？

时间：2020-08-16 16:13:40

标签： python pyspark apache-spark-sql

SparkVersion 3.0

我尝试了各种方法来对表进行分组，计算不同的值或过滤数据。

为什么执行groupby并计数需要这么长时间？

SiteName = df['20160201'].select('SiteName','Temperature')
SiteName_Group = SiteName.groupBy("SiteName")
SiteName_Group.count()

0 个答案:

没有答案