将增加的整数Id添加到JavaRDD

时间:2017-11-23 12:10:47

标签: java apache-spark rdd

我有一个简单的JavaRDD<String>喜欢:

("a"),("b"),("c")...

现在我想为每个元素添加增加整数id 。关键是,我想自己定义开始ID ,例如:

("a",5),("b",6),("c",7)...

我知道zipWithIndex()但此方法无法设置开始ID号。也许我可以先zipwithIndex()再做一个map()来增加身份,但还有另一种明确的方法吗?

1 个答案:

答案 0 :(得分:0)

您可以使用.zipWithIndex,然后使用map表示使用您的用户定义值来增加索引。

例如。 rdd.zipWithIndex.map(a=>(a._1,a._2+userDefinedIndexValue))