我有一个内容源,其中包含我想使用solr索引的文档。所以我安装了solr&索引源,它给我索引存储的索引。一切都很好。
现在我的来源有文件添加说每天收到100多个文件,即如果今天是1000,那么明天它将是1100.现在我想确保solr仅索引那些添加为新文件或更新的文件仅在这种情况下100个文档,我也称之为delta索引。
我观察到,solr通过扫描每个文档来进行索引。存储其索引。那么在delta索引的情况下,solr会如何表现?
solr索引只会索引100个新文档,或者solr会扫描所有1100个文档,但只会索引新的100个文档,或者会扫描并扫描所有文档。再次索引所有1100份文件?
这里的想法是优化资源利用率,因为我的来源使用了来自使用它的用户的大量流量,因此我试图最小化索引对其产生的任何影响。
问候。