所以我将旧网站转移到新服务器,并在此过程中尝试清理。
我正在寻找的是一些脚本或免费软件,可以:
a)显示通过网站的路径(以下超链接等),所以我可以看到链接到什么
和b)某些软件可以看到哪些html文件是文件夹结构中的孤儿(未链接)。
对于其中任何一个或两个的任何帮助将不胜感激:)
答案 0 :(得分:1)
答案 1 :(得分:1)
a)显示通过网站的路径(以下超链接等),所以我可以看到链接到什么
所以基本上是一个爬虫?你可以和http库,html解析器和任何品牌的脚本语言一起搅拌。我不知道任何现成的脚本。
和b)某些软件可以看到哪些html文件是文件夹结构中的孤儿(未链接)。
您的网站是否包含普通的html文件,或者是否存在某种服务器端技术,例如PHP?如果是这样,就无法自动检测所述孤儿,因为它们是根据服务器端应用程序生成的,而不是实际页面,即使它们可能在浏览器中显示。
答案 2 :(得分:1)
a)取决于您网站的复杂程度以及内容的动态性,您可以下载任何蜘蛛并将其限制在您的网站上并检查结果(“burp suite”包含一个非常好的蜘蛛,并且这是一个每个人的工具应该知道)。
b)蜘蛛完成其工作后,检查wevsites目录中所有文件的访问时间,任何访问时间早于蜘蛛执行时间的文件可能都是孤儿。
(这两种解决方案在使用用户输入来覆盖页面的网站上效果较差)
答案 3 :(得分:0)
home.snafu.de/tilman/xenulink.html(Xenulink)提供链接抓取,并通过FTP访问,孤立文件检查。