我试图忘记一个页面以及它链接到网站外的一些页面。我想要做的是在网站(主机)上递归到5的深度,然后一旦我跳到另一个主机限制递归说2页。我似乎无法在手册页中找到任何此类选项,我只是运气不好?
答案 0 :(得分:3)
$ wget -r -H -l 2 www.example.com
$ wget -r -l 5 -c www.example.com
第一个命令尝试以递归方式从所需域中下载所有内容,包括从其他主机到递归深度为2的内容。除此之外,它只是忽略所有文件。
在第二个命令中,我们要求Wget仅从主机服务器下载,但这次的递归深度为5. -c
用于请求Wget继续文件传输。这意味着Wget不会尝试重新下载已通过第一个命令下载的所有内容。
以上命令只是概念验证,需要根据您的具体需求进行定制。