我通过JOIN查询加入了2个mysql表,并在SOLR中通过DIH导入了数据。
但是,有一半的记录会自动删除。我通过阅读 numDocs , maxDocs &来了解这一点。 deletedDocs 值。
我已经检查了我已在 data-config.xml 以及 schema.xml 文件中定义的表格中的所有字段。
这有什么问题?
请帮帮我。
答案 0 :(得分:1)
它取代现有文件
numDocs+DeletedDocs = MaxDocs
(821+1160=1981)
numDocs表示索引中可搜索文档的数量 maxDoc可能因numDoc计数而更大,因为它包含尚未从索引中删除的逻辑删除文档。
如果你重新索引/重新发布numDocs将永远不会增加,因为新文件将不断更换旧...尝试优化索引,它可能会删除逻辑上删除的文档/索引。
唯一关键字段
<uniqueKey></uniqueKey>
<uniqueKey>
声明可用于通知Solr索引中有一个字段对于所有文档都应该是唯一的。如果添加的文档包含与现有文档相同的此字段值,则将删除旧文档。