标签: apache-spark
使用DataFrame.coalesce API,我们可以减少分区的数量,我想要在Spark sql中使用相同的功能,所以我会问如何编写sql,
DataFrame.coalesce
在spark sql中,我希望select * from a仅具有10个分区,而实际上可能有100个以上分区
select * from a
答案 0 :(得分:0)
好的,我发现JIRA完全可以满足我的要求,https://issues.apache.org/jira/browse/SPARK-24940