我正在尝试使用以下方式镜像网站:
wget --header 'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' --header 'upgrade-insecure-requests: 1' --header 'user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36' --header 'dnt: 1' --header 'accept-encoding: gzip, deflate, br' --header 'accept-language: en-US,en;q=0.9' --header 'cookie: _ga=GA1.2.3865356.1523153047; ........' -N -m -p -w 3 --convert-links 'mysite.com/
我添加了几个标题,并注意到递归下载没有发生。只下载初始index.html页面。当我查看页面时,我看到了屏幕截图。这里下载了什么。我该如何下载常规的html文件呢?
答案 0 :(得分:0)
如果您添加选项--server-response
,您会在回复的Content-Type
标题中看到什么?有点像text/html
吗?
P.S。:因为您使用了-m
(即--mirror
)选项,所以您也不需要指定标记-N
。