Cassandra 0.7中自动二级索引的可扩展性如何?

时间:2011-02-21 16:10:04

标签: indexing nosql distributed cassandra

据我所知,为节点本地数据生成自动二级索引。

在这种情况下,通过二级索引查询涉及存储列族的一部分的所有节点以获得结果(?)所以(如果我是对的)如果数据分布在50个节点上,则单个查询中涉及50个节点?

这种规模可以达到多远?这比手动二级索引(倒排索引列系列)更具可扩展性吗?几个节点或一百个节点?

2 个答案:

答案 0 :(得分:5)

答案 1 :(得分:1)

是的,如果您需要获取所有索引行,则索引查询涉及所有节点。但这实际上比建立自己的索引更有效! Details here.

但是,如果只查找几行,并且每个索引条目映射到很多行,那么第一个节点很可能能够回答您的问题。您的查询将只涉及一个节点。来自Apache邮件列表:

  

只要您提出要求,第一个节点就可以回答问题   比第一个节点上的行少。因此“低基数”   指出你所引用的内容。

(作者:Jonathan Ellis,here。)

(我还在邮件列表上发了一个问题,对你的问题提出了一个跟进问题, inquisitor ,因为我并不真正理解你问题的答案(在Schildmeijer的回答中链接)。 )