Solr在重建索引时删除/删除所有旧文档

时间:2015-08-07 18:48:30

标签: amazon-web-services solr solrcloud

版本: Solr 4.1

问题陈述:

  1. 当我们点击完全导入的数据导入处理程序时,Solr删除/删除所有旧文档。完全导入完成后,一切正常。

  2. 帮助我理解作为图片附加的JVM值,我正在尝试将其连接到问题。

  3. 根据我的理解,solr不会删除/删除旧文档,直到完全导入新文档。但在我的情况下,它会在部分导入新文档时删除旧文档。

    详细说明:

    1. 我们正在使用具有单个分片和2个副本的Solr Cloud。 S1-R1 -------- S1-R2
    2. 使用亚马逊负载均衡器来平衡每个负载均衡器。
    3. 这两个solr都附属于3个动物园主。
    4. 内存分配:JAVA_OPTS =" $ JAVA_OPTS -Xms8192m -Xmx12288m -XX:PermSize = 3072m -XX:MaxPermSize = 8192m -Xss4m"

    5. solr管理面板显示:

      • 物理内存98.2%
      • 交换空间0.0%
      • 文件描述符数0.2%
      • JVM-Memory 34.3%
    6. Solr Admin Panel JVM info

1 个答案:

答案 0 :(得分:0)

  1. 当我们点击数据导入处理程序的完全导入时,Solr删除/删除所有旧文档。完全导入完成后,一切正常。
  2. - 正如你问干净=真, clean :(默认为'true')。告诉在索引开始之前是否清理索引。

    使用此DIH首先发出“全部删除”更新查询。 然后它开始添加新文档。在完成/完成之后,DIH发出提交,该提交强制执行添加和删除索引开始之前存在的所有旧文档的新文档。

    您也可以选择优化,但这可能是昂贵的操作。

    optimize :(默认为'true'至Solr 3.6,之后为'false')。告诉操作后是否优化。) 请注意:这可能是一项非常昂贵的操作,通常对delta-imports没有意义。