让我们把密钥考虑为((PK1,PK2),Data1)
如何使用
进行查询(PK1 =" A"和PK2在(1,2,3)和数据1> 1和数据1< 2)或(PK1 =" B"和PK2 in (1,2,3)和data1> 1和data1< 2)
答案 0 :(得分:2)
我不相信你可以使用这样的或类似的运算符,所以你可能会创建两个RDD,一个用于“SELECT * FROM t WHERE PK1 ='A'和PK2 IN(1,2,3)AND data1 > 1 AND data1< 2“和一个用于”SELECT * FROM t WHERE PK1 ='B'和PK2 IN(1,2,3)AND data1> 1 AND data1< 2“。
然后你可以将它们组合成一个带有spark union 功能的RDD。