我正在尝试下载在线目录中的所有文件。我正在使用的命令是:
wget -r -np -nH -R index.html
http://www.oecd-nea.org/dbforms/data/eva/evatapes/mendl_2/
使用此命令我得到一个空目录。如果我最后指定文件名,我可以一次得到一个文件名,但我想立刻得到它们。我只是缺少一些简单的东西吗?
从命令输出:
- 2015-03-14 14:54:05-- http://www.oecd-nea.org/dbforms/data/evaevatapes/mendl_2/ 解决www.oecd-nea.org ...... 193.51.64.80 连接到www.oecd-nea.org | 193.51.64.80 |:80 ...已连接。 发送HTTP请求,等待响应... 200 OK 长度:未指定[text / html] 保存到:âdbforms/ data / eva / evatapes / mendl_2 /index.htmlâdbforms/ data / eva / evatapes / mendl_2 /index.htmlârobots.txtârobots.txt
答案 0 :(得分:1)
添加您想要关注的链接深度(-l1
,因为您只想关注一个链接):
wget -e robots=off -l1 -r -np -nH -R index.html http://www.oecd-nea.org/dbforms/data/eva/evatapes/mendl_2/
我还添加了-e robots=off
,因为有robots.txt
通常会阻止wget通过该目录。对于世界其他地区:
-r
递归,-np
没有父目录-nH
没有跨越主机