监控索引大小并确定增长趋势

时间:2013-07-26 09:09:17

标签: lucene

我使用的是商业产品(发现工具),其核心是Apache Lucene(v 3.6.1)。我即将摄取~60K全文以及元数据,我想知道索引大小如何变化。理想情况下,我想每次索引5 / 10K纯文本串并评估指数增长(我预计这是线性的)。我的理解是主文件是.CFS(复合文件),但我似乎只有以下格式:

.FDT (field index)
.FDX (field data)
.FNM (fields)
.FRQ (frequencies)
.NRM (norms)
.PRX (positions)
.TII (term info index)
.TIS (term infos)
.segment.GEN and segment_N (segments)

(我已经阅读了文件.CFS从版本3.0.3变为可选,如果我错了,请纠正我)。推荐的方法是什么?任何建议都非常欢迎!

非常感谢,

0 个答案:

没有答案