lucene指数腐败的原因[Alfresco 4.2]

时间:2018-01-29 10:26:12

标签: lucene alfresco

我在REDHAT 7服务器上运行alfresco 4.2。所以我必须处理Lucene 2.4。 正在处理的问题是Lucene索引越来越频繁地被破坏。每次发生时,回购都会消失。并完全重新索引,使服务器再次上升。

我需要帮助才能更多地了解导致索引损坏的原因。以及如何处理(重新索引需要花费很多时间)

2 个答案:

答案 0 :(得分:0)

我们也在使用Lucene,尽管不是Alfresco。 从我们所看到的情况来看,Lucene给每个文档提供的唯一ID存在问题,有时在向索引添加或删除文档时实际上会改变... 我们还没有进一步,但也许这可以帮助你走上正确的轨道。

答案 1 :(得分:0)

让我在认真开始之前提一下:Alfresco实现了Solr which uses Lucene的索引,因此我不会直接在Alfresco上管理Lucene索引。相反,通过Alfresco提供的Solr工具管理您的索引。

我也发现Lucene / Solr指数在这个版本的Alfresco(4.2.0)中趋于“漂移”。多次参与Alfresco的支持,我们没有发现任何坚实的根本原因;他们说可能归因于我们所做的“某些定制”,但它们并没有比这更具体。

因此,虽然我们没有找到解决方案,但我们采取了积极措施来缓解这一问题。

  1. 我们每天都会检查一份Solr报告(https://your-alfresco-server.com:8443/solr/report/)。在此报告中,有一个值标记为“索引中的事务计数而不是数据库”(根据我的经验,这是一个非常具有误导性的标签)。这个值越高,我们的指数看起来越不同步,所以当它攀升时,我们会在没有人受到影响的时候安排重新索引。

  2. Alfresco服务器提供修复和重新索引Solr的服务。 (完全披露:我没有发现它们非常有效,但它们是由Alfresco支持推荐的。)

  3.   

    Solr重新索引服务:   http://your-alfresco-server.com:8080/solr/admin/cores?action=REINDEX&txid=

         

    Solr“修复”服务:   http://your-alfresco-server.com:8080/solr/admin/cores?action=FIX

    1. 清除陈旧内容可以减少重新索引的时间(这包括Alfresco生成的转移报告等,这些报告往往会累积,但不是 - 至少在我的情况下 - 非常重要)。
    2. 不幸的是,真正的解决方案通常归结为在预定的轮换基础上重新编制索引以最大限度地减少停机时间。