应用错误收集

Googlebot如何知道网络服务器在请求`？_escaped_fragment_ =`URL时没有隐藏？

时间：2011-12-22 05:14:39

标签： ajax googlebot google-crawlers

关于Google的AJAX抓取规范，如果服务器为#!网址返回一个的东西（即一个JavaScript密集的文件），那么 else #!替换为?_escaped_fragment_=时，（即，页面的“html快照”）到Googlebot，感觉就像隐藏在我身上一样。毕竟，Googlebot如何确保服务器返回#!和?_escaped_fragment_=网址的善意等效内容。然而，这就是AJAX抓取规范实际上告诉网站管理员要做的事情。我错过了什么吗？ Googlebot如何确保服务器在两种情况下都返回相同的内容？

1 个答案:

答案 0 :(得分：1)

抓取工具不知道。但它甚至都不知道那些返回普通ol'html的网站 - 根据抓取工具或已知IP头使用的http标头编写隐藏网站的代码非常容易。

请参阅此相关问题：How does Google Know you are Cloaking?

大多数似乎都是猜想，但似乎有各种各样的检查，在欺骗普通浏览器标题和实际真人看页面之间有所不同。

继续猜测，谷歌程序员的能力肯定不会超出谷歌编写一种实际检索用户看到的爬虫形式的能力 - 毕竟，他们有自己的浏览器可以做到这一点。这样做会非常耗费CPU，但对于偶尔的抽查可能是有意义的。

相关问题

Google何时重新抓取网站？

Google如何知道你是隐形眼镜？

什么是monodoc.ashx以及googlebot为什么要求它？

Googlebot如何知道网络服务器在请求`？_escaped_fragment_ =`URL时没有隐藏？

Google如何处理相对_escaped_fragment_ URL-s？

如何知道计算机是网络服务器？

Is it possible to know if automated tools are used

使Google在隐藏时抓取网站

网址包含Captal Letters ||它会降低排名吗？

隐藏真实背后的机制是什么？

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？