如何配置Cassandra以便某些表根本不被复制,而其他表是?这实际上是Cassandra的一个很好的用例吗?
我有一组客户(最多50个),每天都会提供数据(每个客户每天约50,000条记录,每条记录约200个字段)。我需要预处理数据以在本地模糊敏感信息,然后集中组合数据进行分析,然后根据组合数据集进行报告。我计划每个客户都有一个本地Cassandra节点用于原始数据加载(几个平面文件),但我不希望这个复制,直到混淆完成。我可以使用不同的表空间和复制因子吗?如果有帮助,可以使用客户ID作为PK来键入数据。
答案 0 :(得分:2)
您可以拥有复制因子为1的客户原始数据的密钥空间,并将原始数据表保留在那里,然后将混淆数据表放在具有复制因子>的单独密钥空间中。 1.