使用特定参数忽略robot.txt中的URL?

时间:2012-02-05 13:55:15

标签: seo robots.txt

我想谷歌忽略这样的网址:

http://www.mydomain.com/new-printers?dir=asc&order=price&p=3

所有具有参数dir,order和price的网址都应该被忽略,但我没有使用Robots.txt的经验。

有什么想法吗?

3 个答案:

答案 0 :(得分:110)

如果你想禁止查询字符串,这是一个解决方案:

Disallow: /*?*

或者如果您想更精确地查询字符串:

Disallow: /*?dir=*&order=*&p=*

您还可以将robots.txt添加到允许的网址

Allow: /new-printer$

$将确保只允许/new-printer

更多信息:

http://code.google.com/web/controlcrawlindex/docs/robots_txt.html

http://sanzon.wordpress.com/2008/04/29/advanced-usage-of-robotstxt-w-querystrings/

答案 1 :(得分:21)

您可以使用以下行阻止这些特定的查询字符串参数

dir=

因此,如果查询字符串中的任何网址包含order=p=//Invoice number define('INVOICE', '00001'); //Invoice length $invoice_len = strlen(INVOICE); //sprintf formatting string $spf_format = '%0' . $invoice_len . 'd'; //Replace the 5 in %05d with however many characters there will be. //In your case there are 5. //It is now formatted with the 0s at the start. $invoice = sprintf($spf_format, INVOICE); echo $invoice; ,则会被阻止。

答案 2 :(得分:3)

使用Google WebMaster Tools注册您的网站。在那里,您可以告诉Google如何处理您的参数。

网站配置 - >网址参数

您应该让包含这些参数的页面表明它们应该通过robots元标记从索引中排除。例如