使用httrack只下载一个站点,而不是外部站点

时间:2016-12-13 18:12:44

标签: httrack

我尝试使用httrack下载我的phpbb论坛,但无论我使用什么设置,我都不能让它停止下载整个维基百科网站,以及许多其他网站的链接在论坛的任何地方...

我设法做到这一点使它下载索引页,但这也不好。

我认为那个设置

+forum.mysite.com/*
选项中的

- >扫描规则可以解决问题,但它继续下载整个维基百科:(

3 个答案:

答案 0 :(得分:2)

尝试

最大镜像深度= 1(当1无效时,保留此2)

还有

最大外部深度= 0!为我工作

答案 1 :(得分:0)

在这里找到了一个可疑的解决方案:Subject: Re: prevent download of external content

问题是现在外部链接指向一个看起来很难看的页面,这是可以修复的。

然而,像youtube这样的嵌入式内容现在也被这个丑陋的页面取代:(

至少它不再下载整个互联网......

答案 2 :(得分:0)

我会尝试:

-a
    *stay on the same address (--stay-on-same-address)
-d
    stay on the same principal domain (--stay-on-same-domain)