在Drupal搜索结果中显示的未发布项目(谷歌搜索设备)

时间:2009-10-23 19:03:44

标签: drupal search drupal-5 google-search-appliance

我最近继承了Drupal 5网站并进行了一系列改进。其中几个围绕搜索结果。

  1. 显示的未发布页面 搜索引擎结果。其中一些 是旧页面,其他人最近 未公布。一切都正确 在CMS中标记为未发布 仍然出现。

  2. 过期的网页会从搜索引擎中显示出来。 URL路径结构已更改,这些项目是DB中的旧结果。

  3. 据我所知,该网站使用Google Search Appliance(GSA)进行搜索,而非默认的Drupal搜索。有没有一种方法可以确定它使用GSA而不是看到模块启用了?

    如果是GSA,我似乎可以让有权访问GSA的人重建网站上的搜索结果。这是对的吗?

    如果重建搜索结果是正确的方法,那么只要从网站上删除了大量内容,我就需要让某人重建搜索。有更好/自动的方式吗?

4 个答案:

答案 0 :(得分:1)

听起来像处理搜索的drupal。谷歌需要数据库访问才能显示未发布的节点。可能是您正在使用视图进行搜索,但忘记仅使用已发布的节点。

如果Drupal正在处理搜索,则只需要刷新并重建搜索索引。如果您没有太多内容,这可以毫无困难地完成。

答案 1 :(得分:1)

根据您的数据来源,GSA仍然可能会显示已删除的内容。

如果内容来自数据库源,然后从查询中删除,则会将其删除。如果内容来自自然爬网或通过自定义连接器源,则不会在删除时从索引中删除。相反,它需要自然地循环出索引,这可能需要一段时间。

阻止显示已删除网址的一种方法是通过前端进行操作。在GSA Admin界面中,转到Serving>然后选择前端,然后单击“删除URL”选项卡。您可以列出您的网址,也可以通过正则表达式阻止一组网址。

答案 2 :(得分:0)

我已发布您more general question concerning node access的答案。搜索结果的问题可能与此有关。

答案 3 :(得分:0)

为了让Google Appliance保持最新状态,您可以试用XmlSiteMap,这是一个为您的所有内容发布适当的xml站点地图的模块。

对于在线网站,发布站点地图是保持搜索引擎最新的一种好方法,因为他们可以使用它来了解新页面和清除旧页面。我假设Google Appliance也会使用它。