这是Spark / Scala中的一小段代码:
rdd.sortBy(_._2)
_._2
在这里意味着什么?
答案 0 :(得分:3)
在Scala中_2
是访问第二个tuple元素的简写。
val myTuple = ("first", "second")
myTuple._1 // "first"
myTuple._2 // "second"
在您的情况下,rdd
中的所有元组将按第二个元素排序。
例如:
val tuples = Vector(("first", "b"),("second", "c"),("third", "a"))
tuples.sortBy(_._2) //Vector((third,a), (first,b), (second,c))