Cassandra doesn't have capped collections (or row size limits),但模拟它的一种方法是使用离线mapreduce作业清理额外的条目。拥有第二个表来存储另一个表中主键的行计数会更好吗?缺点是您必须扫描整个row_count表,因为计数器不可索引。或者用真实数据扫描支持表会更快吗?
或者我应该研究另一种技术吗?
编辑:我发现了这个Columns count vs counter column performance。行计数遍历所有数据,因此我倾向于远离它。