对于名为"某个页面"的项目,Sitecore会自动生成URL" / some-page"但页面也可以通过" /某些页面"到达。网址不同,但指向相同的Sitecore项目。
内容作者可以在其他网页的链接中使用这两个网址,对于当前的问题,我们假设我们无法改变他们的行为。
如果使用两个链接,Lucene会将两者都添加到搜索索引中,即同一页面被索引两次。两者都有相同的" _id"值,因此它们被识别为相同的项目。
我们如何确保Lucene不添加重复的条目?我们如何配置它永远不会存储相同的" _id"值?
答案 0 :(得分:1)
Sitecore应用程序在索引项目时不会查看网址(如果它是Lucene或Solr,则无关紧要。)
Sitecore会检查ID
项,Language
,Version
和Database
,并在该基础上唯一确定Lucene文档。
如果您打开索引,例如使用Luke,您可以在所有文档中看到_uniqueid
字段,如sitecore://web/{d376c64b-866d-4725-8606-d0462b6ef28a}?lang=en&ver=1
。
项目的ID(存储在Lucene文档的_group
中)不用于Lucene文档的唯一标识。
就链接到您的网页而言,假设您正在谈论Sitecore内部链接,作者只选择目标项目,并且它的Sitecore会生成"用户友好的"链接的版本。因此,您不应该在同一页面上看到不同的网址。