与robots.txt有点混淆。
假设我想在位于基于Linux的Apache服务器上的站点上阻止机器人:
var/www/mySite
我会将robots.txt放在该目录中(与index.php一起),其中包含:
User-agent: *
Disallow: /
正确?
这是否会阻止机器人索引整个服务器或只是var / www / mySite中的站点?例如,var / www / myOtherSite中的站点是否也阻止了机器人?因为我只想为一个网站做这件事。
谢谢!
答案 0 :(得分:2)
机器人(表现良好的机器人,即尊重robots.txt
完全是自愿的)将使用您网域根目录中的robots.txt
。如果mySite
已关闭mysite.com
而myOtherSite
已关闭myothersite.com
,那么robots.txt
只会在mysite.com
上投放,意图。
要进行测试,只需前往http://myothersite.com/robots.txt
并确认您获得了404。