据我所知,为节点本地数据生成自动二级索引。
在这种情况下,通过二级索引查询涉及存储列族的一部分的所有节点以获得结果(?)所以(如果我是对的)如果数据分布在50个节点上,则单个查询中涉及50个节点?
这种规模可以达到多远?这比手动二级索引(倒排索引列系列)更具可扩展性吗?几个节点或一百个节点?
答案 0 :(得分:5)
答案 1 :(得分:1)
是的,如果您需要获取所有索引行,则索引查询涉及所有节点。但这实际上比建立自己的索引更有效! Details here.
但是,如果只查找几行,并且每个索引条目映射到很多行,那么第一个节点很可能能够回答您的问题。您的查询将只涉及一个节点。来自Apache邮件列表:
只要您提出要求,第一个节点就可以回答问题 比第一个节点上的行少。因此“低基数” 指出你所引用的内容。
(作者:Jonathan Ellis,here。)
(我还在邮件列表上发了一个问题,对你的问题提出了一个跟进问题, inquisitor ,因为我并不真正理解你问题的答案(在Schildmeijer的回答中链接)。 )