我正在使用Wordpress插件,及时多合一事件日历。不幸的是,它创建了大量重复的URL,这些URL以({https://www.mywebsite.com/events/action~agenda/page_offset~-2/request_format~json/cat_ids~4)或(https://www.mywebsite.com/events/action~oneday/exact_date~2-4-2019/)之类的字符串结尾。
由于这些URL指令分别用于不同的日历视图,但包含相同的网页标题和内容,因此某些搜索引擎将其视为重复的内容。虽然设置了robots.txt来告诉漫游器忽略包含所述字符串的URL,但某些爬网程序却忽略了robots.txt。我还禁用了各种不同的日历视图,因此现在只有议程视图,尽管如此,机器人仍会继续抓取这些URL。
因此,可以使用Apache / .htaccess指令来指示服务器定向任何包含“ / action〜”的请求,以从URL中删除字符串,以便浏览器仅读取“ / events /”或重定向/将网址转发到另一个页面。
这些URL中有超过500个,因此理想情况下,我想快速采取补救措施!
先谢谢了。
答案 0 :(得分:0)
在您的.htaccess文件中检查此重写
RewriteEngine On
RewriteRule ^events\/action(.*)$ /events/ [L,R=301]