python - 使用HTTrack镜像单个页面

使用HTTrack镜像单个页面

时间：2016-01-14 17:33:11

标签： python http command-line wget httrack

我一直在尝试使用HTTrack来镜像单个页面（下载html +先决条件：样式表，图像等），类似于问题[带有httrack的镜像单页] [1]。但是，那里接受的答案对我来说不起作用，因为我正在使用Windows（其中wget“存在”但实际上是Invoke-WebRequest的包装器并且不能以相同的方式运行）。

HTTrack真的想要（a）下载我指向的整个网站，或者（b）只下载我指向的页面，让所有图像仍然存在于网络上。有没有办法让HTTrack下载足以在线下正确查看单个页面 - 相当于wget -p？

3 个答案:

答案 0 :(得分：1)

这是一篇旧帖子，所以你现在可能已经弄明白了。我刚看到你的帖子，寻找关于使用Python和HTTrack的另一个答案。我遇到了同样的问题，我通过了参数-r2并下载了图像。

我的论点基本上是这样的： cmd = [httrack，myURL，＆＃39; - ％v＆＃39;，＆＃39; -r2＆＃39;，＆＃39; -F＆＃39;，＆＃34; Mozilla / 5.0（Windows NT 6.1; Win64; x64）＆＃34;，＆＃39; -O＆＃39;，saveLocation]

答案 1 :(得分：0)

这 answer 对我有用。

<块引用>

下载了具有所有先决条件的单页 html。试着给予要下载的页面的确切链接，如在上面的答案，使用 GUI，在“-镜像模式-”->“设置选项”->“限制”->“最大外部深度= 0”。

答案 2 :(得分：-1)

使用浏览器保存页面应下载页面及其所有先决条件。