应用错误收集

时间：2014-08-07 10:18:13

标签： seo phantomjs googlebot

背景

我目前正在使用Google的＃！ - 方法通过代理和PhantomJS的组合为动态网站设置SEO索引。我们的网络应用程序不仅托管我们自己的应用程序，还托管由第三方提供的任意数量的应用程序。由于我无法控制这些应用程序（以及它们的加载时间），因此在处理GoogleBot查询时，我现在面临两个选择：

显然我更愿意选择（2），但我担心GoogleBot会在阅读抓取的HTML之前超时。

问题

GoogleBot请求超时前多久？

答案 0 :(得分：0)

简短回答

Google会在响应时间较慢的情况下对网页进行处罚，因此最好在Google收到内容之前主动生成和缓存内容。

答案很长

正如@ArtjomB在评论部分所指出的那样，（2）将永远不会成为一种选择，因为Google会对响应时间较长的网页进行处罚。（1）仅在非时间敏感的索引信息时才是一个选项。

更好的选择是未说明的第三种选择：在任何GoogleBot提取之前主动重新索引和缓存内容的cron-job，尽管这显然需要付出代价，因为X％的重新索引可能最终永远不会出现由GoogleBot提取。