我们目前正在托管一个大型的joomla网站。 谷歌已将我们网页的数百个“印刷版”编入索引。
例如,如果我们有一篇包含url的文章: www.mysite.com/funnyarticle.html
joomla网站自动创建: www.mysite.com/funnyarticle/print.html
我们已移动该网站并删除了这些网页,因此他们现在从谷歌获得了404错误。 我们想重新定位或重写(不确定什么是正确的术语)“打印”网址到各自的文章。
我想使用htaccess删除: /print.html
并将其替换为: html的
我见过示例,但无法让它们正常工作。 所以我希望我能就如何删除和替换上面的确切代码获得具体的建议。
感谢您的时间。
此致
Aforantman
答案 0 :(得分:1)
您可以使用以下行创建robot.txt文件。
User-agent: *
Disallow: /*/print.html
这将禁止搜索引擎漫游器访问名为print.html的文件。
答案 1 :(得分:0)
您可能想要使用RewriteRule
。请参阅Apache的指南,了解如何使用它们:http://httpd.apache.org/docs/2.0/rewrite/rewrite_guide.html
但是,如果您只是希望Google(和其他搜索引擎)忽略这些打印版本,请在您robots.txt
中添加相应的条目。这样你就不需要使用Joomla为你的访问者生成和访问印刷版本的方式。
答案 2 :(得分:0)
您需要将这些行放在DOCROOT/.htaccess
文件中:
RewriteEngine On
RewriteBase /
RewriteRule ^(.*?)/print.html $1.html [L,R=301]
这会将点击其中一个页面的Google用户重定向到正确的文章。如果您的文章名称可以包含/然后从上面删除?
;该规则仍然有效,但可能需要更多μS运行时间: - )
答案 3 :(得分:0)
你可以使用jishnu所说的robots.txt。这是最好的方法。
User-agent: *
Disallow: /*/print.html