我有一个与此类似的Cassandra DB表:
key | name | client
1 A C1
2 B C2
3 C C1
我使用Python(Pycassa)访问我的Cassandra数据库。
有没有办法查询数据库以获得出现次数最多的客户端?例如,在这种情况下,C1
为2
。
我不确定是否可以直接用Pycassa查询Cassandra。如果可能,我怎么能实现,或者我应该使用其他工具?
由于
PS:我需要使用nosql所以请不要建议我使用关系数据库。
答案 0 :(得分:2)
您需要单独跟踪每个客户端的出现次数。如果不需要完美的精确度,您可以使用Cassandra的内置分布式计数器。否则,您将需要使用更准确的方案(计算列,定期重新计算或两者)或将计数器存储在关系数据库中。