我需要帮助,只允许谷歌机器人和雅虎/ MSN机器人通过.htaccess访问我的网站。非常感谢任何帮助。
对于谷歌我得到了,不确定这是否正确...... 允许来自googlebot.com google.com google-analytics.com 满足任何
答案 0 :(得分:2)
我认为你这样做的原因可能是有问题的,但真正做到这一点的唯一方法是报告的用户代理(HTTP请求标头),而不是域 - 并且报告的用户代理很容易被欺骗任何人。 (这通常也是通过robots.txt
控制的,但通常用于相反的目的 - 限制抓取工具,而不是普通用户。)Google和其他人用来抓取网站的服务器不会具有与之相同的名称或IP你列出的名字。
对于Google,http://support.google.com/webmasters/bin/answer.py?hl=en&answer=1061943提供了一些其他官方详细信息。雅虎和MSN将有类似的页面。