删除并阻止不需要的回发字符串

时间:2014-01-10 00:25:55

标签: apache .htaccess mod-rewrite

Google网站管理员页面由于以下内容而发现重复内容:

如果我们采用此动态搜索页面example.com/armin-music-page-1

google在“page-1”之后发现了回发字符串,如下例所示

example.com/armin-music-page-1$dneix

example.com/armin-music-online-page-1&q=sa=x&ei=-a

example.com/music-dance-club-mix-page-1%balbla

example.com/armin-search-page-1#einx 和许多随机回发字符串

我的问题是,我如何通过apache mod_rewrite .htaccess删除或重定向到“page-1”之后生成的任何内容,以便谷歌找到干净的网址

提前谢谢!

1 个答案:

答案 0 :(得分:0)

您可以通过重定向到已删除的网址来删除page-1之后的内容:

RewriteRule ^(.+-page-1)(.+)$ /$1? [L,R=301]

(规则需要靠近htaccess文件的顶部)

或者如果你想发送到404:

RewriteRule ^(.+-page-1)(.+)$ - [L,R=404]

但有一件事你不能做的是处理看起来像这样的请求:

example.com/armin-search-page-1#einx

因为URL #einx部分永远不会发送到服务器,所以服务器无法与之匹配。所有apache和mod_rewrite看到的都是/armin-search-page-1