标签: apache-spark apache-spark-sql
所有内容都在标题中:从DataFrame中应用
df.groupBy($"col1", $"col2", $"col3").agg(...)
如何将数据框重新划分到群集中?是否通过给定的键将数据分割为分区?
如果我们喜欢:
df.repartition($"col1", $"col2", $"col3").groupBy($"col1", $"col2", $"col3").agg(...)
火花行为会改变吗?
Thx