我读过一篇文章,教我如何通过搜索引擎机器人抓取我的ajax页面,当我使用片段网址#!时它工作得很好,但现在我正在尝试创建一个“主页”没有使用meta标签的片段:
<meta name="fragment" content="!" />
我正在使用下面的代码片段来了解googlebot发生了什么。
<?php
if( isset( $_GET['_escaped_fragment_'] ) )
{
echo "Crawler is gonna read that page!";
}
?>
事实是机器人没有在_escaped_fragment_语句中返回任何值。
以下是该页面的链接:http://www.linkerama.com/novo/
当我使用浏览器时,这个值会返回一个值:http://www.linkerama.com/novo/?_escaped_fragment_=
答案 0 :(得分:24)
你是如何测试的?如果您使用“抓取为Google”,请阅读以下内容。
John Mueller(谷歌员工)的http://productforums.google.com/forum/#!category-topic/webmasters/crawling-indexing--ranking/bZgWCJTnl08%5B1-25%5D引用
查看您博客的主页时,需要注意的一点是,Googlebot抓取功能不能解析其提取的内容。因此,当您提交toddmoyer.net/blog/时,它会获取该URL。获取URL后,它不解析它以检查“fragment”元标记,它只是将它返回给您。但是,如果你获取toddmoyer.net/blog/#! ,然后它应该重写URL并获取URL toddmoyer.net/blog/?_escaped_fragment_=。
当我们抓取您的网页并将其编入索引时,我们会注意到元标记并采取相应措施。它只是Fetch as Googlebot功能,不检查元标记,而只是返回原始内容。
希望有所帮助。