这是我使用wget的方式:
wget --recursive --level=10 --convert-links btlregion.ru
页面http://btlregion.ru/重定向到http://www.btlregion.ru/。当我像上面那样运行wget
时,它会遵循重定向,但只会下载该页面 - 而不是递归所有页面。
我已经尝试了--max-redirects=1
和--domains=www.btlregion.ru
,但它不起作用。
如果我直接在http://www.btlregion.ru/上调用wget
,则递归下载有效。
答案 0 :(得分:12)
您需要将--span-hosts
(-H
)与--domains
一起使用:
wget --recursive --level=10 --convert-links -H \
--domains=www.btlregion.ru btlregion.ru
--span-hosts
允许wget
关注指向其他域的链接,--domains
将此限制为仅跟踪指向所列域名的链接,以避免下载互联网。
选项--domains
与直觉相反,仅与-H
一起使用。这在文档中提到过,但是很难理解。