Cassandra只加入二级指数

时间:2018-04-29 12:42:11

标签: apache-spark cassandra rdd

Actualy我正在使用spark和cassandra来完成一些工作。我想使用joinWithCassandraTable加入带有cassandra的RDD。

在我的情况下,我只需要使用二级索引,但看起来我也必须添加分区键。

Myrdd.repartitionByCassandraReplica(keyspace, table)
  .joinWithCassandraTable(keyspace, table).on(SomeColumns(MY_KEY))

当MY_KEY是分区键时,它的工作但不是二级索引。你知道怎么做吗?

https://github.com/datastax/spark-cassandra-connector/blob/master/doc/2_loading.md#using-joinwithcassandratable我得到了这个:

  

joinWithCassandraTable与其他CassandraRDD API的兼容性joinWithCassandraRDD的结果与所有标准CassandraRDD api选项兼容,并带有一个附加函数.on。使用.on(ColumnSelector)指定要连接的列。由于.on仅适用于CassandraJoinRDDs,因此必须紧跟joinWithCassandraTable调用。

     

只要可以将其加入到有效的CQL查询中,就可以加入主键中的任何一列或多列。这意味着必须指定整个分区键,如果指定了任何群集键,则还必须提供所有以前的群集键。

0 个答案:

没有答案