Alfresco:启用“内容索引”时索引创建停滞不前

时间:2016-04-12 09:54:36

标签: alfresco solr4

我正在尝试索引Alfresco 4.0.d 5.0.d社区存储库(Alfresco Solr):

  • 约500,000份文件
  • Repo-Size约80GB

仅元数据索引:没有问题:索引在大约一小时内就绪。

启用内容索引:Solr索引似乎陷入困境。大约4个小时后,Solr Webinterface显示没有剩余的事务,但仍然没有将Index标记为就绪,并且Solr在让索引器运行时一直尝试创建/更新索引。大约12小时后停止索引,Solr Webinterface中没有显示进度。指数规模一直在增长。

Alfresco Docs的“排除索引索引”提示没有任何区别。

我在Solr中启用了Debugging,并且我没有明显的错误(没有内存错误,根本没有明显的错误)。我只在日志文件中看到:Solr似乎试图反复索引相同的Alfresco事务ID(参见日志摘录,这些行反复弹出)。

  • 任何想法我如何追查其原因?
  • 是否可以在存储库中找到属于交易ID的文档?
  • 是否可以将某些特定交易排除在索引之外?

谢谢,Max

日志摘录

2016-03-10 00:52:15,145 INFO  [org.alfresco.solr.tracker.AclTracker] Scanning Acl change sets ...
2016-03-10 00:52:15,145 INFO  [org.alfresco.solr.tracker.AclTracker] .... none found after lastTxCommitTime 1457481600850
2016-03-10 00:52:15,145 INFO  [org.alfresco.solr.tracker.AclTracker] total number of acls updated: 0
2016-03-10 00:52:15,145 INFO  [org.alfresco.solr.tracker.AbstractTracker] ... Running ContentTracker for core [archive].
2016-03-10 00:52:15,146 INFO  [org.alfresco.solr.SolrInformationServer] .... registered Searchers for archive = 1
2016-03-10 00:52:15,146 INFO  [org.alfresco.solr.Cloud] Running query FTSSTATUS:Dirty OR FTSSTATUS:New
2016-03-10 00:52:15,146 INFO  [org.alfresco.solr.tracker.ContentTracker] total number of docs with content updated: 0
2016-03-10 00:52:15,146 INFO  [org.alfresco.solr.tracker.AbstractTracker] ... Running MetadataTracker for core [archive].
2016-03-10 00:52:15,147 INFO  [org.alfresco.solr.SolrInformationServer] .... registered Searchers for archive = 1
2016-03-10 00:52:15,155 INFO  [org.alfresco.solr.Cloud] Running query TXID:1 AND TXCOMMITTIME:1399544992347
2016-03-10 00:52:15,155 INFO  [org.alfresco.solr.tracker.MetadataTracker] Verified first transaction and timestamp in index
2016-03-10 00:52:15,156 INFO  [org.alfresco.solr.tracker.MetadataTracker] Verified last transaction timestamp in index less than or equal to that of repository.
2016-03-10 00:52:15,161 INFO  [org.alfresco.solr.tracker.MetadataTracker] Scanning transactions ...
2016-03-10 00:52:15,161 INFO  [org.alfresco.solr.tracker.MetadataTracker] .... from Transaction [id=947618, commitTimeMs=1457521663509, updates=2, deletes=2]
2016-03-10 00:52:15,161 INFO  [org.alfresco.solr.tracker.MetadataTracker] .... to Transaction [id=947654, commitTimeMs=1457524857746, updates=1, deletes=0]
2016-03-10 00:52:15,164 INFO  [org.alfresco.solr.tracker.MetadataTracker] Scanning transactions ...
2016-03-10 00:52:15,164 INFO  [org.alfresco.solr.tracker.MetadataTracker] .... from Transaction [id=947654, commitTimeMs=1457524857746, updates=1, deletes=0]
2016-03-10 00:52:15,165 INFO  [org.alfresco.solr.tracker.MetadataTracker] .... to Transaction [id=947655, commitTimeMs=1457524858267, updates=2, deletes=1]
2016-03-10 00:52:15,180 INFO  [org.alfresco.solr.tracker.MetadataTracker] Scanning transactions ...
2016-03-10 00:52:15,180 INFO  [org.alfresco.solr.tracker.MetadataTracker] .... none found after lastTxCommitTime 1457524858267
2016-03-10 00:52:15,180 INFO  [org.alfresco.solr.tracker.MetadataTracker] total number of docs with metadata updated: 0
2016-03-10 00:52:17,513 DEBUG [org.alfresco.solr.content.SolrContentUrlBuilder] Appending SOLR metadata: tenant - _DEFAULT_
2016-03-10 00:52:17,513 DEBUG [org.alfresco.solr.content.SolrContentUrlBuilder] Appending SOLR metadata: tenant - _DEFAULT_
2016-03-10 00:52:17,513 DEBUG [org.alfresco.solr.content.SolrContentUrlBuilder] Appending SOLR metadata: tenant - _DEFAULT_
2016-03-10 00:52:17,513 DEBUG [org.alfresco.solr.content.SolrContentUrlBuilder] Appending SOLR metadata: dbId - 124123
2016-03-10 00:52:17,513 DEBUG [org.alfresco.solr.content.SolrContentUrlBuilder] Converted SOLR metadata to URL: solr://

编辑:添加屏幕截图:

Solr Webadmin

Solr Health Report for Workspace Spaces Store

1 个答案:

答案 0 :(得分:1)

你是如何检查solr是否标记为准备好的? 您是否知道垃圾(存档)和“真实”存储库(工作空间)有单独的索引?日志显示归档跟踪器的输出。 此外,它可能有助于缩小跟踪器配置的大小,并且每个跟踪器只允许一个线程和/或禁用垃圾索引。

索引报告

您检查了索引报告吗?秒。 https://wiki.alfresco.com/wiki/Alfresco_And_SOLR#Direct_URLs。您可能需要在浏览器中导入存储库证书才能访问solr用户界面和alfresco solr报告

请你创建并附上一份露天报告总报告

http://<alfrescoserver>/solr/admin/cores?action=REPORT&wt=xml 

和摘要报告

http://<alfrescoserver>/solr/admin/cores?action=SUMMARY&wt=xml 

交易和节点

您可以检查数据库中的事务。日志告诉你所有的requird信息。在您的代码段中,我找不到日志条目重新索引您告诉的同一节点,但是例如“Transaction id = 947655”表示alf_transaction中id = 947655的行。要从不同的transaction_id中查找所有节点,您只需

select * from alf_node where transaction_id=947655

无法跳过不同的事务,但您可以将cm:indexControl附加到您不想编制索引的节点。请检查http://docs.alfresco.com/4.0/concepts/admin-indexes.html