在Google网站站长工具中,在抓取错误下,我的头号404错误称为
www.domain.com/a
我的网站中没有这样的内容,也没有链接。有什么不对,这是什么意思?在站点日志中,没有关于指向/ a的404错误的错误。 W3C检查器说没有错误。我该怎么办?
答案 0 :(得分:3)
不是你,它必须是Googlebot。 (这些都与php无关; 也许有人可以删除php标签。)
我的Google网站站长工具中有八个网站,两个完全不相关的网站也显示了相同的内容。显示此问题的站点都不使用PHP。
我唯一能想到的是Google的机器人错误地解析HTML并以某种方式将“a”标签附加到根URL上。听起来很愚蠢,但这是唯一可以解释这个问题的多个不相关的实例。
有没有人在谷歌论坛上开始讨论这个问题?
我不确定这会对根问题产生什么影响,但我把它放在我的htaccess文件中,希望能清除错误的404错误。 ( 修改:这是Google推荐的解决方案。)
Redirect 301 /a http://www.mysite.com
修改强>
向Google帮助论坛报告:
http://www.google.com/support/forum
编辑2:
两个站点都在W3C验证,并且都没有使用PHP。
编辑3:
“/ a”来自jQuery v1.5.2。这是根本原因。
在jQuery中本身就是这一行......
<a href='/a' style='color:red;float:left;opacity:.55;'>a</a>
编辑4:
使用robots.txt文件阻止它。 (根据谷歌的说法,这只会将网站管理员工具抓取错误从“404”更改为“被robots.txt阻止”)
Disallow: /a/
Disallow: /a
编辑5:
以下是Google员工JohnMu在the thread I started at Google Groups中对此问题的回复。看起来我打算坚持使用301。
JohnMu
Google员工
凌晨4:39
大家好
这是一个简短的说明 - 是的,我们 正在为许多人提供“/ a”链接 来自jQuery JavaScript的网站。然而, 如果我们这通常不是问题 将“/ a”视为404,那就是 对我们来说很好。与其他404-URL一样, 我们将其列为抓取错误 网站管理员工具,但同样,不是 会成为爬行的问题, 索引或排名。如果你想 确保它不会触发 网站管理员工具中的抓取错误,然后是我 会推荐301重定向 该主页的URL(不允许 该URL也会将其作为一个 抓取错误 - 它将被列为 robots.txt禁止访问的网址)。
我也建议不要明确 不允许抓取jQuery 文件。虽然我们一般不会 我们可能需要自己索引它 访问它以产生良好的即时 您网站的预览。
总而言之:如果你看到“/ a” 在网站管理员中的抓取错误 工具,你可以留下它 那,它不会造成任何问题。如果 你希望把它移到那里,你 可以做301重定向到你的 主页。
干杯
约翰
答案 1 :(得分:1)
检查Apache错误日志。或者安装一个小的PHP文件,保存$_SERVER["HTTP_REFERER"]
,如:
<?php
$f = fopen("logfile.txt", "a");
fwrite ($_SERVER["HTTP_REFERER"] . "\n");
fclose ($f);
然后创建一个 .htaccess 文件,将对/ a的调用重定向到此PHP:
Options FollowSymLinks
RewriteEngine On
RewriteRule ^a$ somthing.php
或者,您可以将PHP保存在名称/a/index.php
上,这样就不需要重定向。
答案 2 :(得分:1)
从您的网络主工具帐户执行301重定向或以其他方式执行网址删除请求。
GWT - &GT;网站配置 - &gt;抓取访问权限 - &gt;网址删除请求