标签: http download web httrack
我尝试使用HTTrack下载此处网址的搜索请求结果
不幸的是,下载立即开始并且没有获得搜索结果(因为页面仍显示轮子)。
问题:是否可以在第一页请求后强制暂停,或者在开始之前定义检查(例如页面上的关键字搜索)?
最坏的情况:是否有其他网站复印机可以做到这一点?
非常感谢,汤姆
答案 0 :(得分:0)
HTTrack有许多选项可配置为允许或禁止对网站的某些方面进行爬网。使用HTTrack抓取博客的post可能很有用。
HTTrack的另一种可能替代方法是使用wget镜像网站。 Here是使用wget创建镜像的过程。