如何跟踪网站内的链接

时间:2010-07-13 13:22:03

标签: html optimization web

所以我将旧网站转移到新服务器,并在此过程中尝试清理。

我正在寻找的是一些脚本或免费软件,可以:

a)显示通过网站的路径(以下超链接等),所以我可以看到链接到什么

和b)某些软件可以看到哪些html文件是文件夹结构中的孤儿(未链接)。

对于其中任何一个或两个的任何帮助将不胜感激:)

4 个答案:

答案 0 :(得分:1)

http://haveamint.com/说明了一切,美丽的GUI,简单的集成,轻量级,数据库存储,JavaScript跟踪。

有一个薄荷(y)

或者你可以使用谷歌分析器这些天几乎被每个站点使用

答案 1 :(得分:1)

  

a)显示通过网站的路径(以下超链接等),所以我可以看到链接到什么

所以基本上是一个爬虫?你可以和http库,html解析器和任何品牌的脚本语言一起搅拌。我不知道任何现成的脚本。

  

和b)某些软件可以看到哪些html文件是文件夹结构中的孤儿(未链接)。

您的网站是否包含普通的html文件,或者是否存在某种服务器端技术,例如PHP?如果是这样,就无法自动检测所述孤儿,因为它们是根据服务器端应用程序生成的,而不是实际页面,即使它们可能在浏览器中显示。

答案 2 :(得分:1)

a)取决于您网站的复杂程度以及内容的动态性,您可以下载任何蜘蛛并将其限制在您的网站上并检查结果(“burp suite”包含一个非常好的蜘蛛,并且这是一个每个人的工具应该知道)。

b)蜘蛛完成其工作后,检查wevsites目录中所有文件的访问时间,任何访问时间早于蜘蛛执行时间的文件可能都是孤儿。

(这两种解决方案在使用用户输入来覆盖页面的网站上效果较差)

答案 3 :(得分:0)

home.snafu.de/tilman/xenulink.html(Xenulink)提供链接抓取,并通过FTP访问,孤立文件检查。