Google网站管理员页面由于以下内容而发现重复内容:
如果我们采用此动态搜索页面example.com/armin-music-page-1
google在“page-1”之后发现了回发字符串,如下例所示
example.com/armin-music-page-1$dneix
example.com/armin-music-online-page-1&q=sa=x&ei=-a
example.com/music-dance-club-mix-page-1%balbla
example.com/armin-search-page-1#einx 和许多随机回发字符串
我的问题是,我如何通过apache mod_rewrite .htaccess删除或重定向到“page-1”之后生成的任何内容,以便谷歌找到干净的网址
提前谢谢!
答案 0 :(得分:0)
您可以通过重定向到已删除的网址来删除page-1
之后的内容:
RewriteRule ^(.+-page-1)(.+)$ /$1? [L,R=301]
(规则需要靠近htaccess文件的顶部)
或者如果你想发送到404:
RewriteRule ^(.+-page-1)(.+)$ - [L,R=404]
但有一件事你不能做的是处理看起来像这样的请求:
example.com/armin-search-page-1#einx
因为URL 的#einx
部分永远不会发送到服务器,所以服务器无法与之匹配。所有apache和mod_rewrite看到的都是/armin-search-page-1
。