我制作一个“纯粹的javascript”网页(使用HTML5历史API,如Grooveshark或similars),一切正常,但问题是它的SEO,特别是Facebook& google spiders / tracks。
我的想法是使用PHP vars $ _SERVER跟踪“浏览器”,并且“浏览器”是一个特定的字符串,显示不同的HTML(不仅是带有未执行的javascript的主页,AKA没有内容)
但我有一些问题,首先,我不知道Facebook,谷歌和其他跟踪器的“字符串”。
有什么想法解决这个问题吗? (不允许使用clasic HTML网站:P)
由于
答案 0 :(得分:1)
您可以阅读User-Agent
字符串,并识别抓取工具。 Here是完整的值列表。举个例子:facebook bot使用facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)