我正在编写一个程序,我有一个RDD [String]和一个CassandraTableScanRDD,我想在它们之间进行左连接。
这可能吗?从我在网上看到,加入只是在CassandraTableScanRDD之间徘徊。
答案 0 :(得分:1)
join
个函数可用于PairRDD
个对象(请参阅here)。
PairRDD
对象是键值对的RDD,例如:RDD[(Int, String)]
通常,您使用PairRDD
函数从常规RDD
创建keyBy
对象,该函数允许您指定要使用的密钥。然后当你运行join
时,它会加入键相等的元素。