Spark:groupBy如何重新分区数据

时间:2018-07-17 09:27:32

标签: apache-spark apache-spark-sql

所有内容都在标题中:从DataFrame中应用

df.groupBy($"col1", $"col2", $"col3").agg(...)

如何将数据框重新划分到群集中?是否通过给定的键将数据分割为分区?

如果我们喜欢:

df.repartition($"col1", $"col2", $"col3").groupBy($"col1", $"col2", $"col3").agg(...)

火花行为会改变吗?

Thx

0 个答案:

没有答案