鉴于Cassandra有两张桌子:
xs (id bigint, x bigint)
0,10
1,11
2,12
3,13
4,14
ys (id bigint, y bigint)
0,100
2,144
4,196
在这个最小的例子中,我想得到xs
中id
尚未包含在ys
中的所有行,即
select
1,11
3,13
我怎样才能做到这一点?
根据我想在ys
中创建新行的所选行,基本上同步(仅添加)ys
到xs
。
这是我创建密钥空间/表的代码:
from cassandra.cluster import Cluster
cluster = Cluster()
session = cluster.connect()
session.execute('DROP KEYSPACE keyspace_x;')
session.execute('DROP KEYSPACE keyspace_y;')
session.execute('''
CREATE KEYSPACE keyspace_x
WITH replication = {
'class' : 'SimpleStrategy',
'replication_factor' : 1
};''');
session.execute('''
CREATE KEYSPACE keyspace_y
WITH replication = {
'class' : 'SimpleStrategy',
'replication_factor' : 1
};''');
session.execute('''CREATE TABLE keyspace_x.xs (
id bigint,
x bigint,
PRIMARY KEY (id)
);''');
session.execute('''CREATE TABLE keyspace_y.ys (
id bigint,
y bigint,
PRIMARY KEY (id)
);''');
session.execute('INSERT INTO keyspace_x.xs(id, x) VALUES (%s, %s)',(0, 10))
session.execute('INSERT INTO keyspace_x.xs(id, x) VALUES (%s, %s)',(1, 11))
session.execute('INSERT INTO keyspace_x.xs(id, x) VALUES (%s, %s)',(2, 12))
session.execute('INSERT INTO keyspace_x.xs(id, x) VALUES (%s, %s)',(3, 13))
session.execute('INSERT INTO keyspace_x.xs(id, x) VALUES (%s, %s)',(4, 14))
session.execute('INSERT INTO keyspace_y.ys(id, y) VALUES (%s, %s)',(0, 100))
session.execute('INSERT INTO keyspace_y.ys(id, y) VALUES (%s, %s)',(2, 144))
session.execute('INSERT INTO keyspace_y.ys(id, y) VALUES (%s, %s)',(4, 196))
在SQL I would use something like that
中SELECT xs.id, xs.x FROM xs
LEFT JOIN ys ON xs.id = ys.id
WHERE ys.id IS NULL;
但是CQL呢?
目前我只是从两个表中获取所有ID并在我的应用程序中进行设置差异,但我想这远非最佳。
答案 0 :(得分:2)
没有多表功能。 How implement LEFT or RIGHT JOIN using spark-cassandra-connector您可以在Cassandra上添加关系图层。 How to do a join queries with 2 or more tables in cassandra cql您可以徒劳地搜索手册。 http://cassandra.apache.org/doc/latest/cql/dml.html重新浏览/ Google搜索:其他SQL方法可以执行您想要的操作EXCEPT
又名MINUS
& NOT IN
。代数功能是DIFFERENCE
又名MINUS
& ANTIJOIN
)。