如何找到我的网站上不需要的文件,以便删除它们?

时间:2010-06-30 20:25:55

标签: web dreamweaver

我正在开发一个网站,在测试了不同的方法之后,我知道我的网站上有很多文件没有被使用,包括HTML / PHP文件,图像,样式表和外部脚本。有没有我可以使用的程序或其他东西所以我可以找到我不需要的所有文件,所以我可以删除它们?

我需要找到所有可以安全删除的文件,不再与网站有任何关系,删除它们对我网站的工作方式没有任何影响。

我尝试在Dreamweaver中找到孤立的文件,但它列出了我实际需要的很多文件。

6 个答案:

答案 0 :(得分:2)

这里有一个想法:抓取网站并创建您可以找到的每个文件的列表,然后检查该列表中没有的任何内容。维基百科有一个list of crawlers,包括一些开源的。

答案 1 :(得分:1)

Xenu的linkleuth是我发现的最简单方法 http://home.snafu.de/tilman/xenulink.html

执行扫描后,您可以选择输入FTP信息。如果这样做,它还会生成一个无法访问的文件列表(孤儿)。

答案 2 :(得分:0)

您如何获得不必要的资格?在开始之前你需要确定这一点。我想垃圾收集你的网站的一种方法是删除没有被任何其他文件引用的文件。

答案 3 :(得分:0)

爬虫@Brendan获取实际使用的所有文件的想法非常好。

然后,您可以开始删除您网站上的文件,之后使用程序查找您网站中的任何损坏的链接,例如XenuLinkTiger,或者您喜欢的链接。

答案 4 :(得分:0)

您可以连接某些ftp应用程序,并删除文件手册。这是最安全的方式,因为脚本和程序不知道需要什么,不知道什么......

答案 5 :(得分:0)

在提出此问题时不存在此功能,但是为此目的设计了一个名为weborphans的Python脚本。

这是作者的博客条目,其中包含更多信息:Finding orphaned files on websites