HTTrack提供filter options,但我无法弄清楚如何下载某个子文件夹级别并忽略所有其他子文件夹。
示例:
domain.com/
domain.com/pets/
domain.com/pets/elephant
domain.com/zoo/tiger
domain.com/pics/giraffe
domain.com/pics/giraffe/details
我只想下载子文件夹elephant
,tiger
和giraffe
作为HTML,包括从那里链接的图片。
HTTrack强大吗? (我使用的是Windows GUI版本" WinHTTrack"。)
PS:将此作为程序选项,例如, "最小镜像深度"。
答案 0 :(得分:3)
我找到了一种方法:
-*
-domain.com/*[path]/*
-domain.com/*[path]
+domain.com/*[path]/*[path]/*
-domain.com/*/specialfolder*
+domain.com/*specialimages*.jpg
-mime:*/* +mime:text/html +mime:image/*
仅发布:要获取所有网址,仅指定根域以及第一级子文件夹是不够的(例如:domain.com/pets,domain.com/zoo,domain.com/pics)。< / p>