htaccess从url中删除print.html

时间:2012-07-11 06:25:22

标签: .htaccess

我们目前正在托管一个大型的joomla网站。 谷歌已将我们网页的数百个“印刷版”编入索引。

例如,如果我们有一篇包含url的文章: www.mysite.com/funnyarticle.html

joomla网站自动创建: www.mysite.com/funnyarticle/print.html

我们已移动该网站并删除了这些网页,因此他们现在从谷歌获得了404错误。 我们想重新定位或重写(不确定什么是正确的术语)“打印”网址到各自的文章。

我想使用htaccess删除: /print.html

并将其替换为: html的

我见过示例,但无法让它们正常工作。 所以我希望我能就如何删除和替换上面的确切代码获得具体的建议。

感谢您的时间。

此致

Aforantman

4 个答案:

答案 0 :(得分:1)

您可以使用以下行创建robot.txt文件。

User-agent: *
Disallow: /*/print.html

这将禁止搜索引擎漫游器访问名为print.html的文件。

答案 1 :(得分:0)

您可能想要使用RewriteRule。请参阅Apache的指南,了解如何使用它们:http://httpd.apache.org/docs/2.0/rewrite/rewrite_guide.html

但是,如果您只是希望Google(和其他搜索引擎)忽略这些打印版本,请在您robots.txt中添加相应的条目。这样你就不需要使用Joomla为你的访问者生成和访问印刷版本的方式。

答案 2 :(得分:0)

您需要将这些行放在DOCROOT/.htaccess文件中:

RewriteEngine On
RewriteBase   /

RewriteRule   ^(.*?)/print.html $1.html [L,R=301]

这会将点击其中一个页面的Google用户重定向到正确的文章。如果您的文章名称可以包含/然后从上面删除?;该规则仍然有效,但可能需要更多μS运行时间: - )

答案 3 :(得分:0)

你可以使用jishnu所说的robots.txt。这是最好的方法。

User-agent: *
Disallow: /*/print.html