将爬网程序指向HTML快照

时间:2012-05-06 04:53:41

标签: php html ajax

我正在努力让我的AJAX网站可以抓取:

Here is the website in question.

  • 我创建了一个生成页面的htmlsnapshot.php(此文件需要传递散列片段才能生成正确的内容)。
  • 我不知道如何让普通用户加载普通文件时如何让抓取工具加载此文件。
  • 我真的不明白抓取工具对哈希片段做了什么(这可能是我问题的一部分。)

有人有任何提示吗?

1 个答案:

答案 0 :(得分:2)

爬虫会转移自己。您只需配置PHP脚本来处理Google将发送您网站的GET参数(而不是依赖于AJAX)。

基本上,当Google找到指向yourdomain.com/#!something的链接而不是请求/并运行JavaScript来发送数据something的AJAX请求时,Google会自动 (没有你做任何事情)将你的网址#!之后的所有内容翻译为?_escaped_fragment_=something

您只需(在您的PHP脚本中)检查是否设置了$_GET['_escaped_fragment_'],如果是,则显示该值为something的内容。

实际上很容易。