pyspark Sortby没有处理多个值?

时间:2016-02-24 18:45:57

标签: pyspark

假设我有rdd包含4个元组(a,b,c,d)的数据,其中a,b,c和d都是整数变量

我尝试仅基于d变量对订单上的数据进行排序(但是没有最终确定,所以我尝试做其他事情) 这是当前代码I type

sortedRDD = RDD.sortBy(lambda (a, b, c, d): d) 

然而,我检查了最终数据,但似乎结果仍未得到纠正

# I check with this code
sortedRDD.takeOrdered(15)

1 个答案:

答案 0 :(得分:0)

您应该在{{1}}:

中再次指定排序顺序
{{1}}

由于您在排序后未收集数据,因此无法保证后续操作中的订单,请参阅以下示例:

{{1}}