Robots.txt申请

时间:2016-07-11 11:01:57

标签: robots.txt

网站中的应用程序是否可以拥有自己的robots.txt文件?

例如,我有一个在http://www.example.com下运行的网站,其中包含robots.txt文件。

然后我们在此域下运行一个单独的网站作为应用程序:http://www.example.com/website-app

是否可以将robots.txt文件与应用程序分开,或者是否需要将应用程序的所有内容放入主根robots.txt?

1 个答案:

答案 0 :(得分:0)

robots.txt文件需要驻留在/robots.txt中,没有办法告诉抓取工具可以在其他任何地方找到它(例如,对于favicons)。因此,如果可以,您应该将其添加到根robots.txt(或将您的应用程序放在子域中,而不是将其放在可以拥有自己文件的位置)。

如果您想单独控制特定网页,可以改为使用<meta> - 代码,如robotstxt.org所述。由于这需要放在每个页面上,它将有爬虫访问(但不是索引)至少一个页面,但它不会跟随其他页面(除非你告诉它)。对于子目录中的小应用程序,这可能是一个很好的解决方案。