我有一个矢量RDD。假设RDD的向量值遵循
1 1 1
2 2 2
3 3 3
我想将其转换为以下
1 2 3
1 2 3
1 2 3
以下两个载体中的任何一个对我都没问题。
org.apache.spark.util.Vector
org.apache.spark.mllib.linalg.Vector
可以通过将RDD转换为List / Array来本地完成,以获取无法实现的大数据。我在网上找到了一些为 Scala 编写的代码。知道如何为Java Spark做到这一点?我使用的是Java-7,因此没有lambda表达式。
******我已经添加了一条评论,说明为什么可能重复的问题的解决方案没有帮助我。