使用wget下载编码页面?

时间:2018-04-19 20:13:38

标签: wget

enter image description here

我正在尝试使用以下方式镜像网站:

wget --header 'accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8' --header 'upgrade-insecure-requests: 1' --header 'user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36' --header 'dnt: 1' --header 'accept-encoding: gzip, deflate, br' --header 'accept-language: en-US,en;q=0.9' --header 'cookie: _ga=GA1.2.3865356.1523153047; ........'  -N -m -p -w 3 --convert-links  'mysite.com/

我添加了几个标题,并注意到递归下载没有发生。只下载初始index.html页面。当我查看页面时,我看到了屏幕截图。这里下载了什么。我该如何下载常规的html文件呢?

1 个答案:

答案 0 :(得分:0)

如果您添加选项--server-response,您会在回复的Content-Type标题中看到什么?有点像text/html吗?

P.S。:因为您使用了-m(即--mirror)选项,所以您也不需要指定标记-N