遵循重定向后,Wget不会递归下载

时间:2013-11-17 11:33:44

标签: linux redirect wget

这是我使用wget的方式:

wget --recursive --level=10 --convert-links btlregion.ru

页面http://btlregion.ru/重定向到http://www.btlregion.ru/。当我像上面那样运行wget时,它会遵循重定向,但只会下载该页面 - 而不是递归所有页面。

我已经尝试了--max-redirects=1--domains=www.btlregion.ru,但它不起作用。

如果我直接在http://www.btlregion.ru/上调用wget,则递归下载有效。

1 个答案:

答案 0 :(得分:12)

您需要将--span-hosts-H)与--domains一起使用:

wget --recursive --level=10 --convert-links -H \
--domains=www.btlregion.ru btlregion.ru

--span-hosts允许wget关注指向其他域的链接,--domains将此限制为仅跟踪指向所列域名的链接,以避免下载互联网。

选项--domains与直觉相反,-H一起使用。这在文档中提到过,但是很难理解。