wget如何只保存链接到目标页面链接的页面的某些文件类型,而不管某些文件所在的域名?
尝试加快我必须经常完成的任务。
我一直在浏览wget文档并使用Google搜索,但似乎没有任何效果。我继续只获取目标页面或没有文件的子页面(甚至使用-H),所以我显然在这方面表现不佳。
因此,实际上,example.com/index1/包含指向example.com/subpage1/和example.com/subpage2/的链接,而子页面包含指向example2.com/file.ext和example2.com/file2的链接。但是,example.com / index1.html可以链接到example.com/index2/,它链接到我不想要的更多子页面。
甚至可以做到这一点,如果没有,那么你建议我使用什么?感谢。
答案 0 :(得分:15)
以下命令对我有用。
wget -r --accept "*.ext" --level 2 "example.com/index1/"
需要递归执行,因此应添加-r
。
答案 1 :(得分:1)
这样的事情应该有效:
wget --accept "*.ext" --level 2 "example.com/index1/"