cassandra - 聚类键中的粒度级别（高唯一值）

聚类键中的粒度级别（高唯一值）

时间：2015-06-22 15:41:49

标签： cassandra data-modeling cassandra-2.0

我对cassandra数据建模并不熟悉。我试图了解我是否可以在群集密钥中具有高唯一值。例如：我们有4列。 Storeid，shipping_status，orderid和guestname。我们每天有大约3000家商店，4种状态类型和高级订单。我们需要查询storeid，status和有时orderid。所以我试图将storeid和status作为分区键，orderid作为集群键。所以我的问题是我可以在群集密钥中保留这么低的粒度级别列。 orderid每天都会拥有巨大的独特ID。如果我在群集密钥中添加guestname也会有任何问题。 tnx为您的建议。

1 个答案:

答案 0 :(得分：0)

使用storeid和shipping_status作为分区键的一部分，然后使用orderid作为群集键，使情况与时间序列数据非常相似。

Cassandra非常适合存储具有该数据模型的东西（在前CQL术语中称为“宽行”），并且限制是针对每个分区的2x10E9（2亿个）聚类键值设置的。

所以你不应该选择“开放式”分区，而是使用分块：你可以有一个分区密钥，storeid + status + year是每年的订单量远小于2x10E9，或{{1如果你是亚马逊。

要回答你的第二个问题，不，没有问题让所有列都成为主键的一部分。