卡桑德拉:柱族与超级柱族

时间:2012-06-25 22:41:39

标签: database-design nosql cassandra

我有一个要求,我需要我的数据库来存储以下数据:

- For each build, store the results of 3 performance runs. The result includes tps and latency. 

阅读cassandra数据模型,这会直接映射到以下格式的超级列族:

BenchmarkSuperColumnFamily= {

build_1: {
   Run1: {1000K, 0.5ms}
   Run2: {1000K, 0.5ms}
   Run3: {1000K, 0.5ms}
}

build_2: {
   Run1: {1000K, 0.5ms}
   Run2: {1000K, 0.5ms}
   Run3: {1000K, 0.5ms}
}
...

}

但是,我在下面的answer中读到,不鼓励使用Super Column系列。我想知道是否有更好的方法为我的要求创建模型。

PS,我借用了以下article

中的JSONish表示法

1 个答案:

答案 0 :(得分:6)

您链接的StackOverflow答案是正确的。您不应该在新应用程序中使用SuperColumns。但它们的存在是为了向后兼容。

通常,复合列可用于模拟超级列提供的任何模型。基本上,它们允许您将列名分成多个部分。因此,如果您要指定'CompositeType(UTF8Type,UTF8Type)'的比较器,您的数据模型最终会看起来像这样:

BenchmarkColumnFamily= {

   build_1: {
       (Run1, TPS) : 1000K
       (Run1, Latency) : 0.5ms
       (Run2, TPS) : 1000K
       (Run2, Latency) : 0.5ms
       (Run3, TPS) : 1000K
       (Run3, Latency) : 0.5ms
    }

    build_2: {
       ...
    }
...

}

使用上述模型,您可以使用单个查询为单次运行获取单个数据点,为单次运行获取所有数据点,或者为多次运行获取所有数据点。

有关复合列的更多信息: http://www.datastax.com/dev/blog/introduction-to-composite-columns-part-1