有没有让谷歌蜘蛛可以读取json数据?

时间:2010-04-07 19:11:18

标签: json seo web-crawler

是否有可能让Google蜘蛛可以读取JSON数据?

例如,假设我有一个包含电子商务网站数据的JSON Feed。此JSON数据用于在用户浏览器中填充人类可读的页面。 (IE从JSON数据到人工显示页面的转换是在用户浏览器内完成的;不是我的选择,只是我给予的工作,它是一个旧的遗留CGI应用程序而不是实际的服务器端脚本语言。)

我担心的是,谷歌蜘蛛无法在谷歌点击它时提取/直接链接到有问题的项目,被提供一个充满所有项目的索引页面,而不是直接链接到他们点击的项目。

无论如何,在JSON中“告知”谷歌蜘蛛他们应该为用户提供不同的链接吗?

2 个答案:

答案 0 :(得分:5)

虽然Google在某些情况下会对JavaScript进行抓取和编制索引,但如果可能的话,仍然最好提供“普通”(X)HTML内容。在这种情况下,有助于了解网站设置的其余部分,特别是:JSON内容仅用于创建产品页面链接的源(带有静态内容),或者所有产品页面也是由JSON提要生成的?如果订阅源仅用于指向实际产品页面(它们是静态的),那么使产品页面可被发现的一种方法可能是创建HTML站点地图页面或其他一些替代形式的导航。 XML Sitemap文件也可以提供帮助,但我建议不要将其用作使产品页面可被发现的唯一方法。

如果只能通过JSON Feed访问所有内容,那么我认为如果您希望通过搜索结果访问该内容,则必须进行更大的更改。

处理它的一种方法也可能是使用新的JavaScript抓取/索引建议,这通常会导致在您的网站和Google之间设置无头浏览器:http://code.google.com/web/ajaxcrawling/(无论是设置还是修改网站的其余部分更容易说: - ))

答案 1 :(得分:2)

您应该围绕JSON数据在服务器端代码中创建一个包装页面,并使用包装器或常规版本响应请求,具体取决于User-Agent。