卡桑德拉在表格中计算唯一值吗?

时间:2018-10-23 21:05:27

标签: python-2.7 count datatables timeout cassandra-3.0

我已经寻找了很长一段时间,但是我却无法找出如何计算Cassandra中表的唯一值?我知道计数功能COUNT(*),但是由于表中的记录太多,因此它总是超时并显示以下错误消息:

错误消息

ReadTimeout: Error from server: code=1200 [Coordinator node timed out waiting for 
replica nodes' responses] message="Operation timed out - received only 1 responses." 
info={'received_responses': 1, 'required_responses': 1, 'consistency': 'ONE'}

问题

我在一个表中存储了70,000多个记录,但是有重复项,因为这些记录中的每一个都有与之关联的不同日期。但是不管这些日期如何,我都希望能够计算出我总共有多少个唯一记录ID。有没有脚本或方法可以做到这一点?

老实说,由于我对Cassandra 3.0和Python 2.7还是很陌生,所以逻辑甚至会有所帮助,所以我不确定这样做的最佳方法是什么?

谢谢!

0 个答案:

没有答案