对于一个用例,我需要在弹性搜索索引中添加和删除多个文档。我的理解是tf-idf或BM25分数受使用发帖列表(?)计算的频率的影响。但是,如果我一天添加和删除许多文档,会影响文档/单词统计?
我已经使用了很多API,但是如果是这种情况,或者是否有办法让我每天强制ElasticSearch每天更新/重新计算索引,那么我未经训练的眼睛都无法定位... < / p>
任何帮助将不胜感激
谢谢
答案 0 :(得分:0)
“分数的IDF部分可能会受到删除和修改的影响”,其余的应该没问题...(Igor Motov)