我是否需要VPS或共享服务器是否可用于Ajax可抓取网站?

时间:2012-12-10 10:13:12

标签: javascript ajax seo hosting

我正在一个1& 1共享服务器上托管一个网站,我需要我的ajax加载的内容可以被谷歌机器人抓取...该网站是“哈希爆炸”准备但现在我正在努力与escaped_fragment部分。 我必须安装HtmlUnit,Node.js或Zombie.js来帮助谷歌处理我的javascript事件。

现在我不明白在服务器上安装这个软件的地方?

当我收集信息时,我意识到我可能必须在虚拟服务器(VPS)上托管它才能访问根目录或安装库...我是对的吗?

我真的很高兴我的年度托管费增加三倍只是为了帮助谷歌查找我的内容...你知道如何在共享主机上实现可抓取的ajax吗?

如果没有,有没有办法在其他地方托管这些图书馆,同时保持网站现在的位置?

我正在寻找实用的信息,因为谷歌对此并没有多大帮助,而且在线文章并没有真正进入托管部分。谢谢你的帮助!

1 个答案:

答案 0 :(得分:0)

因此,您通过带有hashbang网址的AJAX提供博客文章。然后,您需要为抓取支持执行的唯一操作是使用_escaped_fragment_=work-stuff处理URL,使其以HTML格式返回与从相应的hashbang URL #!work-stuff通过AJAX返回的内容相同的内容。< / p>

例如,我们从您的网站获取以下网址作为示例:http://www.youpiemonday.com/#!arcena。当浏览器在此处导航时,它会从以下“丑陋”网址接收数据:http://www.youpiemonday.com/arcena/?_=1355151916735。我认为只需处理由抓取工具生成的网址(例如http://www.youpiemonday.com/?_escaped_fragment_=arcena),并将其映射到您为“丑陋”网址返回的相同内容。这样您就可以提供索引的主要内容。

对于无头浏览器,如果您的页面是根据许多小型AJAX请求收到的数据构建的,那么将需要它,并且整个页面表示(其主要内容)根本不存在于服务器上。然后你可以使用无头浏览器自己“浏览”这些页面,并将结果页面快照存储在某个缓存中,爬虫可以从中获取plain-html版本。

对我来说,在查看网站后,答案是否定的 - 您不需要VPS。