Question

Actualy我正在使用spark和cassandra来完成一些工作。我想使用joinWithCassandraTable加入带有cassandra的RDD。

在我的情况下，我只需要使用二级索引，但看起来我也必须添加分区键。

Myrdd.repartitionByCassandraReplica(keyspace, table)
  .joinWithCassandraTable(keyspace, table).on(SomeColumns(MY_KEY))

当MY_KEY是分区键时，它的工作但不是二级索引。你知道怎么做吗？

从https://github.com/datastax/spark-cassandra-connector/blob/master/doc/2_loading.md#using-joinwithcassandratable我得到了这个：

joinWithCassandraTable与其他CassandraRDD API的兼容性joinWithCassandraRDD的结果与所有标准CassandraRDD api选项兼容，并带有一个附加函数.on。使用.on（ColumnSelector）指定要连接的列。由于.on仅适用于CassandraJoinRDDs，因此必须紧跟joinWithCassandraTable调用。

只要可以将其加入到有效的CQL查询中，就可以加入主键中的任何一列或多列。这意味着必须指定整个分区键，如果指定了任何群集键，则还必须提供所有以前的群集键。

Cassandra只加入二级指数

0 个答案: