我有一个列系列,我通过DataStax Enterprise Search的SolR HTTP API向某些应用程序公开。在某些用例中,我认为最好直接访问cql层。
当仔细研究基础数据模型时,我发现SolR中的唯一性是mapped to the partition key in Cassandra,而没有使用带有聚类列的复合键。
这不会产生每个分区一个宽行? 并不是一个穷人"大数据集的数据模型?
答案 0 :(得分:2)
Solr架构中的唯一键应该是括号内的所有分区和群集列的逗号分隔列表。支持复合分区键以及复合主键。
是的,您确实为每个分区键获得了一个宽存储行,但您可以选择将Cassandra主键中的列作为集群列还是作为分区键使用。如果您认为Cassandra中的存储行是两个宽,请将其中一个聚类列移动到复合分区键中,或者为此目的添加另一个列。
平衡分区数和分区宽度当然很关键,但DSE / Solr并不限制您的选择。