我已经寻找了很长一段时间,但是我却无法找出如何计算Cassandra中表的唯一值?我知道计数功能COUNT(*),但是由于表中的记录太多,因此它总是超时并显示以下错误消息:
错误消息
ReadTimeout: Error from server: code=1200 [Coordinator node timed out waiting for
replica nodes' responses] message="Operation timed out - received only 1 responses."
info={'received_responses': 1, 'required_responses': 1, 'consistency': 'ONE'}
问题
我在一个表中存储了70,000多个记录,但是有重复项,因为这些记录中的每一个都有与之关联的不同日期。但是不管这些日期如何,我都希望能够计算出我总共有多少个唯一记录ID。有没有脚本或方法可以做到这一点?
老实说,由于我对Cassandra 3.0和Python 2.7还是很陌生,所以逻辑甚至会有所帮助,所以我不确定这样做的最佳方法是什么?
谢谢!