我拥有一个在大学注册的网站空间。不幸的是,谷歌在网站上发现了我的简历(简历),但却将其误读为学术出版物,这搞砸了Google学术搜索等引用计数。我尝试将robots.txt
上传到我的本地子目录中。问题是Google会忽略此文件,而是使用为学校域列出的规则。
也就是说,网址看起来像
www.someschool.edu/~myusername/mycv.pdf
我上传了一个robots.txt,可以在这里找到
www.someschool.edu/~myusername/robots.txt
谷歌忽略了它,而是将robots.txt
用于学校的域名
www.someschool.edu/robots.txt
如何让Googlebot忽略我的简历?
答案 0 :(得分:3)
可悲的是,robots.txt
被定义为GET /robots.txt
时获得的任何内容,因此您无法将其用于您的子目录。
如果您可以使用自定义X-Robots-Tag
文件,则可以使用.htaccess
HTTP标头。这是Google's documentation on X-Robots-Tag
。