在我的网站中,他们是一个链接到PDF的按钮。让我们说按钮上的当前pdf网址是http://www.abc.come/wp-content/uploads/2016/09/xyz.pdf,这个网址是google bot已经抓取过了。管理员上个月后发布新的pdf,请说http://www.abc.come/wp-content/uploads/2016/09/xyz-latest.pdf并更新按钮上的网址。
问题是googlebot仍在使用xyz.pdf抓取旧网址,并在网站管理员工具中提供404。
我们如何让googlebot停止抓取旧网址并抓取新网址。
感谢。
答案 0 :(得分:-1)
在网站管理员下转到Google索引 - >删除URLS。从此处删除您的网址,然后从您的应用中删除。适合我。
答案 1 :(得分:-1)
我有同样的问题,我的解决方案是.htaccess中的条目,带有410('消失')状态代码。一段时间后谷歌停止爬行。 但我也读到,谷歌将在404时停止抓取。但在我的网站上,它一直在抓取404个网站。