当我使用seoMOZ运行页面抓取时,某些页面显示为重复内容。
例如:
/index.php
和
/index.php/
正在被抓取为两个单独的页面。我如何实现mod-rewrite以仅从.php文件中删除尾部斜杠?
另外
mysite.com/dir/
和
mysite.com/dir/index.php
被标记为重复内容。出于美观原因,我宁愿将所有“/dir/file.php”链接重定向到“/ dir /”,但我不确定如何做到这一点,或者从SEO的角度来看,这是最好的做法
感谢您的帮助和建议。
答案 0 :(得分:0)
尝试这样的事情:
DirectorySlash Off
RewriteEngine On
RewriteBase /
RewriteCond %{REQUEST_FILENAME} !=d
RewriteCond %{REQUEST_URI} \.php
RewriteRule ^(.*)$ $1 [L,R=301]
请求的文件扩展名为.php
时删除尾部斜杠。
我没有测试但是如果路径正确,它应该可以工作。
您应该知道没有尾部斜杠的请求会列出目录内容。请检查此link
答案 1 :(得分:0)
一些想法:
在每个HTML网页的非规范版本的部分添加rel =“canonical”链接。
取自http://support.google.com/webmasters/bin/answer.py?hl=en&answer=139394
这意味着您只能将一个页面设置为要编制索引的“原始”或“权威”页面,而不是包含相同内容的页面。例如,这非常适合按标签显示帖子的页面。
ALSO
您可以进行重定向。破解你的htaccess并用查询字符串重定向所有查询。
RewriteCond %{QUERY_STRING} .
RewriteRule (.*) $1?
然而,有很多方法可以解决这个问题。