我对apache spark的sortBy方法很感兴趣。
以下是我正在查看的其中一个项目中使用的示例。 我不清楚这里正在进行排序。查看spark文档也不清楚。分区方法使用的分区数是多少?
public void doSorting(JavaDStream<Foo> stream, int num) {
return stream.map(foo -> foo.getKey().sortBy(key -> key, true, num).collect())
}
答案 0 :(得分:0)
sortBy
使用RangePartitioner
来重新排列数据。 numPartitions
确定Partitioner
使用的分区数(输出RDD
使用的分区数)。