我将从Web服务器下载整个目录,如下所示:
wget -r -nH https://something.com/blah/
但/ blah /下有一个index.xml,它对我想要下载的文件没有正确的href。
因此,当我在上面启动wget
命令时,它只会下载index.xml并停止。
我无法修改或删除index.xml文件,因为/ blah /不归我所有。
是否有任何变通方法允许我下载整个目录,忽略index.xml建议的内容?
答案 0 :(得分:1)
来自man wget
:
Recursive Accept/Reject Options
-A acclist --accept acclist
-R rejlist --reject rejlist
Specify comma-separated lists of file name suffixes or patterns to accept
or reject. Note that if any of the wildcard characters, *, ?, [ or ], appear
in an element of acclist or rejlist, it will be treated as a pattern, rather
than a suffix.
因此--reject xml
应该可以解决您的问题。