Sitecore Lucene - 重复条目

时间:2017-03-27 11:13:31

标签: lucene sitecore

对于名为"某个页面"的项目,Sitecore会自动生成URL" / some-page"但页面也可以通过" /某些页面"到达。网址不同,但指向相同的Sitecore项目。

内容作者可以在其他网页的链接中使用这两个网址,对于当前的问题,我们假设我们无法改变他们的行为。

如果使用两个链接,Lucene会将两者都添加到搜索索引中,即同一页面被索引两次。两者都有相同的" _id"值,因此它们被识别为相同的项目。

我们如何确保Lucene不添加重复的条目?我们如何配置它永远不会存储相同的" _id"值?

1 个答案:

答案 0 :(得分:1)

Sitecore应用程序在索引项目时不会查看网址(如果它是Lucene或Solr,则无关紧要。)

Sitecore会检查ID项,LanguageVersionDatabase,并在该基础上唯一确定Lucene文档。

如果您打开索引,例如使用Luke,您可以在所有文档中看到_uniqueid字段,如sitecore://web/{d376c64b-866d-4725-8606-d0462b6ef28a}?lang=en&ver=1

项目的ID(存储在Lucene文档的_group中)不用于Lucene文档的唯一标识。

就链接到您的网页而言,假设您正在谈论Sitecore内部链接,作者只选择目标项目,并且它的Sitecore会生成"用户友好的"链接的版本。因此,您不应该在同一页面上看到不同的网址。