Google如何处理相对_escaped_fragment_ URL-s?

时间:2014-04-04 12:03:47

标签: ajax web-crawler google-crawlers

我试图理解Google AJAX抓取。

说,我在example.com处有一个这样的HTML页面:

<title>My Page</title>
<a href="#!foo=bar">Some link</a>

抓取#!foo=bar链接时,Google会抓取example.com?_escaped_fragment=foo=bar。作为对此的回应,我将提供以下HTML:

<title>My Other Page</title>
<a href="#!blah=zap">Another link</a>

现在问题是,Google会如何看待#!blah=zap链接?我看到两种可能性:

  • Google会将该网址视为example.com?_escaped_fragment=blah=zap,并会成功获取该网页。

  • Google会发现此相对网址确实已解析为example.com?_escaped_fragment=foo=bar#!blah=zap,并且无法抓取我想要的网页。

那可能是哪种方式?

PS。有什么方法可以测试吗?我一直在使用&#34; Fetch as Google&#34;服务,但它没有告诉我它将如何抓取它在页面上找到的链接。

1 个答案:

答案 0 :(得分:2)

您检查过:Full specification of _escaped_fragment_

关于您的问题,我建议Google将其解释为:“Google会将该网址视为example.com?_escaped_fragment=blah=zap,并会成功获取该网页。”