在lucene索引部分,我开始使用StoredField,我不需要索引字段(在我使用StringField之前用于相同的字段)。
这基本上是为了减少一些索引空间。
我正在处理包含100万条记录的文件,但我没有看到任何性能差异。但很快我可能需要处理超过1亿条记录。
所以,我想知道当我使用StoredField与StringField进行比较时是否会有任何性能损失?
由于 香卡
答案 0 :(得分:0)
我的猜测是你的任务是I / O绑定而不是CPU绑定因为文档合并花费的时间最多,而不是简化索引(对于StringField
来说非常便宜)。
分析可能有助于揭示这种猜测是否不正确。