如果Disallow路径与Drupal的目录不同,这是否重要?

时间:2014-11-27 10:55:31

标签: drupal drupal-7 robots.txt google-crawlers

我正在寻找所有标签页面的NOINDEX,即

http://example.com/tags/tabs
http://example.com/tags/people

如果我将以下内容添加到我的robots.txt页面(请参阅:http://jsfiddle.net/psac2uzy/

Disallow: /tags/
Disallow: /tags/*

这会阻止Google索引我的所有代码页吗?

即使这些路径与Drupal结构不同(因为Drupal会在数据库中保留内容)?

2 个答案:

答案 0 :(得分:0)

注意:您不能禁止使用robots.txt进行索引,您只能禁止抓取related answer)。

重要的是您的用户(其中​​包括搜索引擎)看到的实际网址。他们无法访问您的后端,因此他们甚至不知道您的网站是如何协同工作的。

Disallow: /tags/(不需要另一个*)意味着不应抓取路径以/tags/开头的所有网址。因此,假设robots.txt位于http://example.com/robots.txt,这将阻止例如:

  • http://example.com/tags/
  • http://example.com/tags/foo
  • http://example.com/tags/foo/bar

如果你的标签在不同的URL下可用(例如,Drupal的默认/taxonomy/term/…),并且机器人找到这些替代URL,它当然可以抓取它们。因此,始终重定向到您要使用的一个规范网址通常是一个好主意。

答案 1 :(得分:-1)

之前添加:

User-Agent: *
Crawl-Delay: 10
Disallow: /tags

(也许您可以尝试不清理网址:Disallow: /?q=tags

查看this页面了解详情。

希望有所帮助