由于软件升级,我在网站的.htaccess(大约700)中达到了相当数量的重定向。我认为其中一半已被谷歌索引。如何找到当前正在使用的重定向列表?
我的想法是在Apache Logs中找到所有“301”,例如:
1.235.117.180 - - [01 / Aug / 2014:06:41:59 +0200]“GET /components/com_acesearch/assets/css/acesearch.css HTTP / 1.1” 301 626 “http://example.com/link1/link2/page-2”“Mozilla / 5.0(Windows NT 6.1; WOW64)AppleWebKit / 537.36(KHTML,像Gecko)Chrome / 36.0.1985.125 Safari浏览器/ 537.36"
是否可以安全地假设所有未列出的重定向都没有被使用(所以我可以删除它们?)
感谢
答案 0 :(得分:1)
不,这不安全,不要只依赖apache日志。某些旧链接可能仍在索引中,以后可以对其进行爬网。
您无法优化重定向吗?你能举一些重定向的例子吗?是不是有模式?使用正则表达式,如果可以找到某种模式(或其中几种模式),则可以非常有效地重写文件。
搜索引擎比Google一样多。如果一切都保持索引很重要,我会保留重定向,但找到模式并将重定向的数量缩减到最大值。 10或者什么。