在Spark / Scala中排序

时间:2019-01-26 18:57:40

标签: apache-spark

val p=sc.parallelize(Seq(("abc",1),("def",2),("ghi",3),("jkl",4)))
val s=p.sortBy{x=>(x._2,false)}

结果如下:

(abc,1)
(jkl,4)
(def,2)
(ghi,3)

有人可以帮我吗?

1 个答案:

答案 0 :(得分:0)

像这样使用{}会导致生成元组(x._2,false)-int,boolean。

按预期丢失的降序错误。

实际上,您是按colX,constantY排序。这个常数是假的。想想SQL。

s=p.sortBy(x=> x._2,false)

是可能是降序排序的正确语法。