我正在尝试从此网站下载所有pdf和ppts:http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
我在Cygwin做:
wget --no-parent -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
但没有下载文件。
在上面的wget命令中我需要更改什么才能使其正常工作?
答案 0 :(得分:16)
需要使用-e robots=off
代码,所以这有效
wget -e robots=off -A.pdf,.pptx -r -l1 http://mlss2011.comp.nus.edu.sg/index.php?n=Site.Slides
另外,一般情况下,请使用--debug标志获取更多帮助。