将文字转换为RDD以用于后续的笛卡尔积

时间:2017-06-28 06:51:01

标签: scala apache-spark rdd

无法在文档中找到以下结果:

 val DIM_Key_Max = rddA.map(x => (x._1)).max 

随后可以转换为单个条目RDD,用于与RDD或者更确切地说是笛卡尔积的联合。

我无处可见。谁可以帮忙?

2 个答案:

答案 0 :(得分:1)

max返回单个对象。要将其转换为单个条目RDD,请使用parallelize

sc.parallelize(List(DIM_Key_Max))

这将返回一个RDD,其中包含一个可以使用的条目,例如作为cartesian的论据。

答案 1 :(得分:0)

你在这里弄错了。 max不会重新启动可以与另一个RDD连接的RDD。

val rdd=sc.parallelize(Array((1,2),(3,4),(5,6))).map(x=>x._1).max
rdd
rdd: Int = 5
rdd.getClass
res2: Class[Int] = int