Solr近实时搜索:重建索引的影响频繁相同的文档

时间:2018-01-26 10:16:29

标签: solr lucene search-engine

我们希望在近实时场景中使用SolR。比方说,我们希望按视图数量对结果进行过滤/排名。

SolR SoftCommit是针对这个用例而制作的,但是:

  • 在实践中,相同的几个文档会经常更新(仅适用于nb_view字段),而大部分文档都不会受到影响。
  • 据我所知,每次更新,甚至部分都是在lucene中完全删除和完全添加文档。

在我看来,在Tlog中有很多次相同的文档是低效的,并且在合并过程中也可能有问题(文档标记n次被删除并添加?)

任何建议/良好做法?

1 个答案:

答案 0 :(得分:1)

您可以使用两件事来支持这种情况:

  1. In place updates:只有该字段是udpated,而不是整个doc。查看您需要使用它们的条件。
  2. ExternalFileFieldType您将值保存在外部文件中
  3. 如果场景很关键,我会尽可能在真实的世界条件下进行测试,并评估。