Lucene:打开IndexReader的计算成本如何随着索引大小而增加?

时间:2013-05-30 07:46:19

标签: search lucene search-engine

我指的是当索引大小急剧增加时,例如从1GB到1TB,打开IndexReader的计算成本将如何增加?这是线性趋势吗?

1 个答案:

答案 0 :(得分:2)

趋势是线性的,但前面的常数应该很小。此外,成本主要是IO而不是CPU。

IndexReader预先加载某些数据结构,如术语索引,删除文档位向量,规范/ FieldCache / doc值(在需要它们的第一个查询上)。除了字段缓存之外,加载这些结构主要是IO(而非CPU)成本,并且每个文档的成本应该是非常低的常数因子。

重/大东西(贴子,存储的字段,术语向量)都留在磁盘上。