Google Bot Crawler一直在尝试抓取生产中我网站上不存在的CSS文件。
它要求:
http://www.mywebsite.com/assets/index-d45678283d4ab9905c3538184826e599.css
生产中不存在这个确切的文件名(生产中的文件名略有不同)。
但是,它请求的CSS文件确实存在于开发中:
http://localhost:3000/assets/index-d45678283d4ab9905c3538184826e599.css
我不确定为什么要求这个文件。
我使用Capistrano(加载“部署/资产”)在部署到生产之前预编译我的资产。
现在,我只是在robots.txt中阻止此文件,但每次部署后它请求的css文件都会更改。
为什么GoogleBot要抓取生产网站中不存在的此文件?我该如何阻止它?
答案 0 :(得分:3)
GoogleBot可能会看到两件事之一:
令我困惑的是,在您的服务器发出404响应之后,它不会忽略它,但Google软件的内部工作方式是黑盒子;没有真正的方法可以告诉它为什么会这样做。
也就是说,他们提供Webmaster Tools Panel,允许您对其索引进行一些自定义等。