如何从我正在处理的RDD中获取行号:
val rdd2 = rdd1
.filter(row => {
// get row number
}
true
})
答案 0 :(得分:3)
val rdd2 = rdd1.zipWithIndex.filter{
case (row, index) => {
// row number is index. (but is not fixed, unless RDD is sorted)
}