标签: python pyspark apache-spark-sql
SparkVersion 3.0
我尝试了各种方法来对表进行分组,计算不同的值或过滤数据。
为什么执行groupby并计数需要这么长时间?
SiteName = df['20160201'].select('SiteName','Temperature') SiteName_Group = SiteName.groupBy("SiteName") SiteName_Group.count()