Cassandra Spark Connector - 涉及多个分区的条件

时间:2015-01-03 17:52:26

标签: apache-spark cassandra

让我们把密钥考虑为((PK1,PK2),Data1)

如何使用

进行查询

(PK1 =" A"和PK2在(1,2,3)和数据1> 1和数据1< 2)或(PK1 =" B"和PK2 in (1,2,3)和data1> 1和data1< 2)

1 个答案:

答案 0 :(得分:2)

我不相信你可以使用这样的或类似的运算符,所以你可能会创建两个RDD,一个用于“SELECT * FROM t WHERE PK1 ='A'和PK2 IN(1,2,3)AND data1 > 1 AND data1< 2“和一个用于”SELECT * FROM t WHERE PK1 ='B'和PK2 IN(1,2,3)AND data1> 1 AND data1< 2“。

然后你可以将它们组合成一个带有spark union 功能的RDD。