网络无法访问:robots.txt无法访问

时间:2014-01-10 10:25:42

标签: robots.txt googlebot

我在尝试在Google上添加我的网站时遇到错误“网络无法访问:robots.txt无法访问Webmaster tools -> http://www.hyponomist.com/

您可以查看我的robots.txt at heresitemap.xml at here

我已经在这里和那里阅读其他帖子,但无法解决/理解。是什么导致了这个问题。此外,我尝试使用Fetch as Googlebot工具下载页面但出现同样的错误。

有谁知道?

提前致谢!

2 个答案:

答案 0 :(得分:4)

当用户代理字符串表示请求来自Googlebot时,您的网络服务器返回503错误,但是当来自浏览器时请求为200。如果您使用http诊断工具,如Fiddler(http://fiddler2.com/),您可以看到这一点。

如果您使用Fiddler发送浏览器发送的相同请求:

GET http://www.hyponomist.com/robots.txt HTTP/1.1
Host: www.hyponomist.com
Connection: keep-alive
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.72 Safari/537.36
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8

回复是:

HTTP/1.1 200 OK
Server: nginx/1.4.4
Date: Fri, 10 Jan 2014 21:34:42 GMT
Content-Type: text/plain; charset=UTF-8
Transfer-Encoding: chunked
Connection: keep-alive
Retry-After: 18000
Last-Modified: Fri, 10 Jan 2014 20:43:28 GMT
Content-Encoding: gzip

如果您更改用户代理以模仿Googlebot:

GET http://www.hyponomist.com/robots.txt HTTP/1.1
Host: www.hyponomist.com
Connection: keep-alive
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Accept-Encoding: gzip,deflate,sdch
Accept-Language: en-US,en;q=0.8

然后回复是:

HTTP/1.1 503 Service Temporarily Unavailable
Server: nginx/1.4.4
Date: Fri, 10 Jan 2014 21:35:25 GMT
Content-Type: text/html; charset=iso-8859-1
Content-Length: 234
Connection: keep-alive
Retry-After: 18000

正是为什么这样做,我不能告诉你。 503通常是服务器暂时过载时发送的错误,但这显然不是这种情况。也许您的防火墙配置不当,并根据请求频率将Googlebot列入黑名单?查看防火墙设置和服务器配置。

答案 1 :(得分:0)

删除尾部斜杠(使用http://www.hyponomist.com代替http://www.hyponomist.com/)可能会有所帮助