我想谷歌忽略这样的网址:
http://www.mydomain.com/new-printers?dir=asc&order=price&p=3
所有具有参数dir,order和price的网址都应该被忽略,但我没有使用Robots.txt的经验。
有什么想法吗?
答案 0 :(得分:110)
如果你想禁止查询字符串,这是一个解决方案:
Disallow: /*?*
或者如果您想更精确地查询字符串:
Disallow: /*?dir=*&order=*&p=*
您还可以将robots.txt添加到允许的网址
Allow: /new-printer$
$
将确保只允许/new-printer
。
更多信息:
http://code.google.com/web/controlcrawlindex/docs/robots_txt.html
http://sanzon.wordpress.com/2008/04/29/advanced-usage-of-robotstxt-w-querystrings/
答案 1 :(得分:21)
您可以使用以下行阻止这些特定的查询字符串参数
dir=
因此,如果查询字符串中的任何网址包含order=
,p=
或//Invoice number
define('INVOICE', '00001');
//Invoice length
$invoice_len = strlen(INVOICE);
//sprintf formatting string
$spf_format = '%0' . $invoice_len . 'd';
//Replace the 5 in %05d with however many characters there will be.
//In your case there are 5.
//It is now formatted with the 0s at the start.
$invoice = sprintf($spf_format, INVOICE);
echo $invoice;
,则会被阻止。
答案 2 :(得分:3)
使用Google WebMaster Tools注册您的网站。在那里,您可以告诉Google如何处理您的参数。
网站配置 - >网址参数
您应该让包含这些参数的页面表明它们应该通过robots元标记从索引中排除。例如