我想下载我已访问过的所有网站。
我正在使用wget:
### Log in to the server. This can be done only once.
wget --save-cookies cookies.txt \
--keep-session-cookies \
--post-data 'email=myemail&password=mypass'\
--delete-after \
https://site/signin
### Now grab the page or pages we care about.
wget --load-cookies cookies.txt \
--keep-session-cookies \
--cookies=on \
--mirror -p --html-extension --convert-links \
https://site/dashboard
使用上面的脚本,我可以下载所有页面:
但当我进入另一个"子文件夹"像:
https://site/sub-folder/page.html
我无法下载" page.html"因为wget无法识别我的登录名和密码或我的cookies(或忘记它,我不知道发生了什么)。
那么如何从该网站下载所有多级内容?