robots.txt文件

时间:2011-12-13 15:12:35

标签: robots.txt

我有一个网址,我想限制搜索引擎进入:

以下是否可以接受:

    User-agent: *
    Disallow: https://mysite.com/

还是我需要更多的东西:

    User-agent: *
    Disallow: https://mysite.com/index.aspx

或者我只是说:

    User-agent: *
    Disallow: /index.aspx

1 个答案:

答案 0 :(得分:0)

最后一个就足够了。您不需要整个网址,如果您将robots.txt转移到另一个网站,您必须更改此文件,这不是您想要的。但你确实需要以/开头,这意味着它是你域名的根源。

或者你可以这样做:

禁止所有

User-agent: *
Disallow: /

禁止1页

User-agent: *
Disallow: /index.php

禁止1个目录

User-agent: *
Disallow: /dirname/

禁止2页和2个目录

User-agent: *
Disallow: /index.php
Disallow: /subpage.php
Disallow: /dirname/
Disallow: /otherdirname/

允许1页(仅限index.php)

User-agent: *
Disallow: /~index.php