防止蜘蛛跟随匹配URL

时间:2011-06-05 19:01:31

标签: .htaccess

如何阻止spriders抓取以mydomain.com/abc ...

开头的网页

例如mydomain.com/abcSGGSHS或mydomain.com/abc6bNNha

我想我需要在web root的.htaccess中添加某种正则表达式,对吗?

1 个答案:

答案 0 :(得分:2)

启用mod_rewrite后,您可以执行以下操作

RewriteEngine on 
RewriteBase / 
RewriteCond %{HTTP_USER_AGENT} ^YourBadSpiderName [OR]
RewriteCond %{HTTP_USER_AGENT} ^AotherBadSpider
RewriteCond %{REQUEST_URI} ^abc
RewriteRule ^$ http://mydomain.com/404.html [NC,L]

您必须相应地更新蜘蛛名称。如果机器人改变了他的用户代理,那么让我们说'Mozilla / Firefox',你运气不好..