使用takeOrdered

时间:2017-07-16 04:36:53

标签: apache-spark pyspark rdd

我是新来的火花并遇到了一个问题。我的RDD如下

names_rdd = sc.parallelize(["abc","def","ghi", "jkl","mno"]);

我很担心如何使用takeOrdered命令按降序排列前三个单词。我期待输出["mno", "jkl", "ghi"]。字符串按字典顺序按降序排列

有人可以帮我解决这个问题。

1 个答案:

答案 0 :(得分:2)

解决方法,

 names_rdd.takeOrdered(3,key=lambda x:-ord(x[0]))

 ['mno', 'jkl', 'ghi']