我有一个WebPage,这是90%的Javascript。所有WebSite都是动态呈现的。
我希望服务器也能呈现此内容,以便Google可以抓取并索引我的所有内容和链接。
我知道为了不被谷歌禁止,动态页面和服务器呈现页面的内容必须几乎相同。
我不想编写两个不同的页面(一个来自带有Handlebars的客户端,另一个来自带有ERB的服务器)。
所以我想到了PhantomJS。我想要的是,当我从谷歌获得_escaped_fragment_ param时,我用PhantomJS打开没有它的页面,我将它从PhantomJS渲染为HTML并将其从服务器返回给Google。这样,我不必为任何东西创建两个不同的页面。
我知道我也可以使用Handlebars进行服务器端模板化,但无论如何我都必须对所有内容进行编码。
有人知道如何使用PhantomJS实现这一目标吗?有没有其他方法可以不重复逻辑和代码两次并让谷歌索引网站?
感谢!!!
答案 0 :(得分:10)
是的,你可以。
将以下内容添加到Javascript密集型页面
<meta name="fragment" content="!">
当Google僵尸程序找到此标记时,它会发出新的http GET请求。这次,它会将?_escaped_fragment_=
添加到您的网址。
因此,如果您的Javascript网页位于:
www.mysite.com/mypage
Google将使用以下网址发布新的GET:
www.mysite.com/mypage?_escaped_fragment_=
在Ruby GET处理程序中,您只需使用未转义的URL调用PhantomJs(只需执行字符串替换)。在你的PhantomJs javascript代码中,等待页面呈现,然后使用常规javascript提取HTML并将其返回到Ruby GET处理程序,在那里您只需使用HTML文本字符串响应GET。
这样您就不必两次编写代码了。该解决方案是通用的,可以对任何内容进行快照。