Pycassa和Cassandra:仅根据列进行选择

时间:2013-09-09 16:40:44

标签: cassandra pycassa

我是这两种技术的新手,我正在努力做到以下几点:

  • 从mytable中选择*,其中column =“col1”或column =“col2”

到目前为止,文档说我应该使用get方法:

 family.get('rowid')

但我没有行ID。我该如何运行上述查询?

由于

1 个答案:

答案 0 :(得分:0)

总的来说,我认为你混合了两个想法。你写的查询是用CQL编写的,Pycassa不支持CQL(至少据我所知)。

但是,通常不管使用的查询界面如何,如果您不知道行键,则必须在查询的列上创建Secondary Indexes

你可以在Pycassa做到这一点,考虑下面的代码片段:

from pycassa.columnfamily import ColumnFamily
from pycassa.pool import ConnectionPool
from pycassa.index import *
from pycassa.system_manager import *

sys = SystemManager('192.168.56.110:9160')

try:
        sys.drop_keyspace('TestKeySpace')
except:
        pass

sys.create_keyspace('TestKeySpace', SIMPLE_STRATEGY, {'replication_factor': '1'})
sys.create_column_family('TestKeySpace', 'mycolumnfamily')

sys.alter_column('TestKeySpace', 'mycolumnfamily', 'column1', LONG_TYPE)
sys.alter_column('TestKeySpace', 'mycolumnfamily', 'column2', LONG_TYPE)

sys.create_index('TestKeySpace', 'mycolumnfamily', 'column1', value_type=LONG_TYPE, index_name='column1_index')
sys.create_index('TestKeySpace', 'mycolumnfamily', 'column2', value_type=LONG_TYPE, index_name='column2_index')

pool = ConnectionPool('TestKeySpace')
col_fam = ColumnFamily(pool, 'mycolumnfamily')

col_fam.insert('row_key0', {'column1': 10, 'column2': 20})
col_fam.insert('row_key1', {'column1': 20, 'column2': 20})
col_fam.insert('row_key2', {'column1': 30, 'column2': 20})
col_fam.insert('row_key3', {'column1': 10, 'column2': 20})

# OrderedDict([('column1', 10), ('column2', 20)])
print col_fam.get('row_key0')

## Find using index: http://pycassa.github.io/pycassa/api/pycassa/
column1_expr = create_index_expression('column1', 10)
column2_expr = create_index_expression('column2', 20)

clause = create_index_clause([column1_expr, column2_expr], count=20)

for key, columns in col_fam.get_indexed_slices(clause):
        print "Key => %s, column1 = %d, column2 = %d" % (key, columns['column1'], columns['column2'])

sys.close

但是,您可以考虑是否可以使用行键来查询数据来设计数据。