我的用例需要在Cassandra上选择Stratio cassandra-lucene-index或Elastic Search。我更倾向于 Stratio实现,因为它不需要创建/管理ES集群。但是,下面的方案使解决方案的实施处于困境。
Cassandra lucene Index 是在高基数列上创建的,例如密钥空间中的 colA 测试(Keyspace为colA提供了超过10,000个唯一记录),并使用Cassandra-lucene-index执行以下查询。
select * from Test where colA like “1%”
现在,上面的查询将要求命中Cassandra集群中的所有节点,因为Cassandra Lucene索引是本地索引。
所以,在这种情况下,查询性能是否会与 Cassandra-lucene-index 相比,从 ElasticSearch 群集返回的结果与Cassandra的数据源相比较随着Keyspace中的数据增加?
工具版: Cassandra 3.10,Stratio cassandra-lucene-index 3.10