假设我们有一个名为a.php的页面
www.site.com/a.php
我们注意到Google抓取工具试图以某种方式访问
www.site.com/a.php/
生成了与a.php
相同的页面。同样,来自a.php
的所有链接也被访问并编入索引。
假设a.php
中有10个链接为
a1.html
a2.html
我看到谷歌也已编入索引:
www.site.com/a.php/a1.html
www.site.com/a.php/a2.html
这是错误的,因为我们在索引中已经有以下内容:
www.site.com/a1.html
www.site.com/a2.html
我们也在.htaccess
进行相对URL重写。我认为这可能是一个问题。
您能否帮助我们如何克服此问题,以阻止使用htaccess
索引新的错误网址。
答案 0 :(得分:0)
使用此规则从非目录中删除尾部斜杠:
RewriteCond %{REQUEST_FILENAME} !-d
RewriteCond %{THE_REQUEST} \s(.+?)/+[?\s]
RewriteRule ^ /%1 [R=302,L]
确保这是您的第一条规则。