mod_rewrite以避免在清理网址后出现重复内容

时间:2012-06-07 05:20:52

标签: mod-rewrite duplicates http-status-code-404

我有典型的mod_rewrite规则,以使网址更漂亮

RewriteRule ^most-viewed-([0-9]+)$ index.php?views=$1

但不知何故,谷歌设法获得了index.php?views =版本,所以现在,在谷歌搜索结果中,两个结果显示,一个是mod_rewrite网址,另一个是“常规”网址。

由于重复内容,这对seo不利,我知道我可以使用规范标记,但是当访问index.php而不被重写规则调用时,我更愿意显示404。

1 个答案:

答案 0 :(得分:1)

你应该在你的网站上查看你的页面,你可以在google上找到index.php?views =。

您可以采取一些措施:

  • 检查您的日志,了解Google抓取工具的具体用途。
    • 如果只有少量页面,则在您的htaccess中手动执行block403或redirect301。
    • 如果有很多页面,请使用高级正则表达式规则对block403或redirect301进行重新设置,以匹配您在htaccess中看到的每个案例。
  • 在您的重复页面上放置规范规则。
  • 禁止使用robots.txt访问该页面。
  • 禁止抓取webmastertools上的“views”参数。

  • 完成上述每个步骤后,请检查您的日志,以确切了解Google抓取工具的用途。