使用HTTrack镜像单个页面

时间:2016-01-14 17:33:11

标签: python http command-line wget httrack

我一直在尝试使用HTTrack来镜像单个页面(下载html +先决条件:样式表,图像等),类似于问题[带有httrack的镜像单页] [1]。但是,那里接受的答案对我来说不起作用,因为我正在使用Windows(其中wget“存在”但实际上是Invoke-WebRequest的包装器并且不能以相同的方式运行)。

HTTrack真的想要(a)下载我指向的整个网站,或者(b)只下载我指向的页面,让所有图像仍然存在于网络上。有没有办法让HTTrack下载足以在线下正确查看单个页面 - 相当于wget -p

3 个答案:

答案 0 :(得分:1)

这是一篇旧帖子,所以你现在可能已经弄明白了。我刚看到你的帖子,寻找关于使用Python和HTTrack的另一个答案。我遇到了同样的问题,我通过了参数-r2并下载了图像。

我的论点基本上是这样的: cmd = [httrack,myURL,' - %v',' -r2',' -F'," Mozilla / 5.0(Windows NT 6.1; Win64; x64)",' -O',saveLocation]

答案 1 :(得分:0)

answer 对我有用。

<块引用>

下载了具有所有先决条件的单页 html。试着给予 要下载的页面的确切链接,如在 上面的答案,使用 GUI,在“-镜像模式-”->“设置选项”->“限制”->“最大外部深度= 0”。

答案 2 :(得分:-1)

使用浏览器保存页面应下载页面及其所有先决条件。