标签: apache-spark
如何在普通RDD中找到第一个元素(因为在PairRDD中,我们可以使用查找(键)API)来满足谓词?在找到第一个元素后,它应该退出RDD遍历。 寻找不使用旧版for循环的解决方案。
答案 0 :(得分:5)
怎么样
rdd.filter(p).top(1)
或者如果您没有RDD上的订单
rdd.filter(p).take(1)
答案 1 :(得分:1)
上述解决方案完全正确。这是实现相同目标的另一种方法
rdd.filter(p).first