Googlebot偶尔会使用错误的查询字符串参数为我们的某个网站编制索引。我不确定它是如何得到这个查询字符串参数(似乎没有任何网站链接到我们与坏链接,我们网站中没有任何东西插入坏值)。错误的参数会导致网站抛出500错误,正如我们所期望的那样。
我认为Google不会将返回500错误的网页编入索引,但事实证明确实如此。所以现在我有两个问题:
1)为什么Googlebot会插入随机错误的查询字符串值? (我真的不关心这个问题的答案,但如果我们能做些什么来避免这个问题,它就能解决我们的问题。)
2)为什么Google会将返回500错误的网页编入索引?
以下是Googlebot创建的以及Google已编入索引的错误链接之一:
http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1
坏参数是gb = baqhuxts。参数'gb'应该是一个整数。如果从查询字符串中删除该参数,则应该显示一个很好的目录页面。
关于nofollow和robots.txt解决方案:[删除]
我现在意识到我是一个白痴并且放了一个元标记告诉搜索机器人索引页面。这是一件愚蠢的事情。我正在删除那些。 W - (
如果您search on Google for 'baqhuxts',您会发现它已使用此错误参数索引了10个页面。但是每个页面都返回500错误。有没有人了解Google为什么认为这些是有效的索引页面?
答案 0 :(得分:4)
这可能是因为您告诉Google通过在元标记中对此进行索引:
<meta name="robots" content="index,follow">
尝试删除它! :)
答案 1 :(得分:1)
不幸的是,我只知道#1的答案:
谷歌会抓取那样奇怪的页面,因为谷歌工具栏的用户会转到不存在的页面,并且他们的浏览信息会传输给谷歌。这就是为什么您经常会发现索引的页面没有被索引的业务,例如,phpmyadmin页面没有链接到任何地方。