下载HTML页面+所有组件的最佳工具/库

时间:2009-05-01 23:55:06

标签: html linux

我正在寻找命令行工具或库(最好是在Perl中)来下载HTML页面及其所有组件:外部CSS,外部JavaScript,图像,flash或其他对象等。

我还没有找到一个工具来做到这一点。我可以下载HTML页面,并解析HTML以查找所有外部链接。但是如果现有的工具能做到这一点,我宁愿不重新发明轮子。

2 个答案:

答案 0 :(得分:7)

WGet可能会满足您的需求,但我不知道它如何与CSS配合使用。

答案 1 :(得分:0)

wget可以很容易地工作,但是ajax / xul / etc和类似的问题它无法处理并且有充分的理由。