我最近继承了Drupal 5网站并进行了一系列改进。其中几个围绕搜索结果。
显示的未发布页面 搜索引擎结果。其中一些 是旧页面,其他人最近 未公布。一切都正确 在CMS中标记为未发布 仍然出现。
过期的网页会从搜索引擎中显示出来。 URL路径结构已更改,这些项目是DB中的旧结果。
据我所知,该网站使用Google Search Appliance(GSA)进行搜索,而非默认的Drupal搜索。有没有一种方法可以确定它使用GSA而不是看到模块启用了?
如果是GSA,我似乎可以让有权访问GSA的人重建网站上的搜索结果。这是对的吗?
如果重建搜索结果是正确的方法,那么只要从网站上删除了大量内容,我就需要让某人重建搜索。有更好/自动的方式吗?
答案 0 :(得分:1)
听起来像处理搜索的drupal。谷歌需要数据库访问才能显示未发布的节点。可能是您正在使用视图进行搜索,但忘记仅使用已发布的节点。
如果Drupal正在处理搜索,则只需要刷新并重建搜索索引。如果您没有太多内容,这可以毫无困难地完成。
答案 1 :(得分:1)
根据您的数据来源,GSA仍然可能会显示已删除的内容。
如果内容来自数据库源,然后从查询中删除,则会将其删除。如果内容来自自然爬网或通过自定义连接器源,则不会在删除时从索引中删除。相反,它需要自然地循环出索引,这可能需要一段时间。
阻止显示已删除网址的一种方法是通过前端进行操作。在GSA Admin界面中,转到Serving>然后选择前端,然后单击“删除URL”选项卡。您可以列出您的网址,也可以通过正则表达式阻止一组网址。
答案 2 :(得分:0)
我已发布您more general question concerning node access的答案。搜索结果的问题可能与此有关。
答案 3 :(得分:0)
为了让Google Appliance保持最新状态,您可以试用XmlSiteMap,这是一个为您的所有内容发布适当的xml站点地图的模块。
对于在线网站,发布站点地图是保持搜索引擎最新的一种好方法,因为他们可以使用它来了解新页面和清除旧页面。我假设Google Appliance也会使用它。