Actualy我正在使用spark和cassandra来完成一些工作。我想使用joinWithCassandraTable加入带有cassandra的RDD。
在我的情况下,我只需要使用二级索引,但看起来我也必须添加分区键。
Myrdd.repartitionByCassandraReplica(keyspace, table)
.joinWithCassandraTable(keyspace, table).on(SomeColumns(MY_KEY))
当MY_KEY是分区键时,它的工作但不是二级索引。你知道怎么做吗?
joinWithCassandraTable与其他CassandraRDD API的兼容性joinWithCassandraRDD的结果与所有标准CassandraRDD api选项兼容,并带有一个附加函数.on。使用.on(ColumnSelector)指定要连接的列。由于.on仅适用于CassandraJoinRDDs,因此必须紧跟joinWithCassandraTable调用。
只要可以将其加入到有效的CQL查询中,就可以加入主键中的任何一列或多列。这意味着必须指定整个分区键,如果指定了任何群集键,则还必须提供所有以前的群集键。