无法抓取网站:URL返回了错误的HTTP响应代码

时间:2013-05-09 07:39:14

标签: facebook debugging response scraper

我注意到之前已经问过这个问题,但还没有其他人收到答案,所以我也会尽力提问。

在过去的几个月里,我的Wordpress网站http://geekvision.tv/已经被Facebook的调试器无法察觉。我设法让我的主页上班一次或两次,但我的所有帖子都完全没有注册调试器,回来说og:url没有明确提供。有关网站帖子的链接,您可以在此处找到:http://geekvision.tv/2013/03/a-message-to-video-game-pirates/

2 个答案:

答案 0 :(得分:1)

Facebook debugger会为您的主页返回以下错误:

  

' http://geekvision.tv'之前有类型'文章'和   不能更改为类型'网站'避免数据   腐败的现有行动。

尝试将og类型更改回<meta property="og:type" content="article">

对于您的其他文章,您的网络服务器返回404错误(尽管发送完整文章)。在让Facebook刮掉其他页面之前,你应该修复这个响应标题。

HTTP/1.1·404·Not·Found
Date:·Thu,·09·May·2013·07:54:07·GMT
Server:·Apache
X-Pingback:·http://geekvision.tv/xmlrpc.php
Link:·<http://wp.me/p2eHBP-1Zz>;·rel=shortlink
Connection:·close
Transfer-Encoding:·chunked
Content-Type:·text/html;·charset=UTF-8
X-Pad:·avoid·browser·bug

答案 1 :(得分:0)

我发现,如果我使用Chrome而不是Safari,Facebook就可以抓取图像并且效果很好。这是我过去4个月遇到的问题的简单答案。希望这可以帮助。