apache中使用的分区数量如何激发RDD sortBy方法?

时间:2018-03-27 21:24:11

标签: java apache-spark

我对apache spark的sortBy方法很感兴趣。

以下是我正在查看的其中一个项目中使用的示例。 我不清楚这里正在进行排序。查看spark文档也不清楚。分区方法使用的分区数是多少?

public void doSorting(JavaDStream<Foo> stream, int num) {

return stream.map(foo -> foo.getKey().sortBy(key -> key, true, num).collect())

}

1 个答案:

答案 0 :(得分:0)

sortBy使用RangePartitioner来重新排列数据。 numPartitions确定Partitioner使用的分区数(输出RDD使用的分区数)。