打开图表刮取基本URL而不是它给出的URL

时间:2013-06-11 22:55:27

标签: facebook magento opengraph

Facebook OpenGraph调试工具正在抓错页面。

如果我给它一个完整的URL(指向我网站上的单个页面),我希望它能够抓取,而不是抓取该页面并找到其元标记,它会刮擦我的网站 main页面并返回那些元标记(在此上下文中显然是错误的)。

奇怪的是,它甚至会找到并抓住我网站的主页,即使它不在我的域的根目录下。例如:
我希望它刮掉http://mydomain.com/myhomepage/specific_page.html
相反,它会刮擦http://mydomain.com/myhomepage/

这对我来说意味着错误必须是某个地方的设置,无论是在我的网站上还是在我的Facebook App设置上。应用程序设置会这样做吗?如果请求的URL是其后代,则重定向到所设置的URL? 我请求的URL不是302或其他任何东西 - 我可以点击FB调试工具中的链接,它会将我带到相应的页面。

一些注意事项:

  • specific_page.html不是实际文件,它使用Apache的htaccess中的mod_rewrite通过index.php进行路由。我尝试使用http://mydomain.com/myhomepage/index.php/specific_page.html具体,但它也不起作用。
  • 另一个问题让我相信,如果用户代理不允许使用Cookie(因为Facebook网络抓取工具没有),可能会重定向用户代理,所以我打开了一个新的浏览器,禁用了cookie,再次尝试,我仍然到达了合适的页面。

1 个答案:

答案 0 :(得分:3)

正如上面的评论所述,在您的情况下,这是由于og:url元标记,将Facebook的抓取工具重定向到该网址

一般情况下,这种情况通常是og:url标记,HTTP重定向或指向“其他”/“错误”网址的规范元标记 - Facebook的抓取工具会遵循这些重定向来查找最终的网址