用RDD [String]加入CassandraTableScanRDD [CassandraRow]

时间:2016-09-02 20:36:07

标签: scala apache-spark cassandra

我正在编写一个程序,我有一个RDD [String]和一个CassandraTableScanRDD,我想在它们之间进行左连接。

这可能吗?从我在网上看到,加入只是在CassandraTableScanRDD之间徘徊。

1 个答案:

答案 0 :(得分:1)

join个函数可用于PairRDD个对象(请参阅here)。

PairRDD对象是键值对的RDD,例如:RDD[(Int, String)]

通常,您使用PairRDD函数从常规RDD创建keyBy对象,该函数允许您指定要使用的密钥。然后当你运行join时,它会加入键相等的元素。