从MySQL导入JOINed表时,数据已自动删除

时间:2015-05-21 11:29:35

标签: mysql solr solrcloud dataimporthandler solr-schema

我通过JOIN查询加入了2个mysql表,并在SOLR中通过DIH导入了数据。

但是,有一半的记录会自动删除。我通过阅读 numDocs maxDocs &来了解这一点。 deletedDocs 值。

我已经检查了我已在 data-config.xml 以及 schema.xml 文件中定义的表格中的所有字段。

这有什么问题?

请帮帮我。

1 个答案:

答案 0 :(得分:1)

它取代现有文件

numDocs+DeletedDocs = MaxDocs 
 (821+1160=1981)

numDocs表示索引中可搜索文档的数量 maxDoc可能因numDoc计数而更大,因为它包含尚未从索引中删除的逻辑删除文档。

如果你重新索引/重新发布numDocs将永远不会增加,因为新文件将不断更换旧...尝试优化索引,它可能会删除逻辑上删除的文档/索引。

唯一关键字段

<uniqueKey></uniqueKey>

<uniqueKey>声明可用于通知Solr索引中有一个字段对于所有文档都应该是唯一的。如果添加的文档包含与现有文档相同的此字段值,则将删除旧文档。