如何使用wget

时间:2016-07-05 22:23:36

标签: linux wget

我正在尝试从此网站(http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/)下载一些特定文件,它们会保留10天的数据。我想下载以" ST4"开头的所有文件。来自" nam_pcpn_anal"开头的所有目录。我可以下载所有盯着" ST4"的文件从一个文件夹,如:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/nam_pcpn_anal.20160625/'

但我不知道如何递归搜索ST4。我认为下面的内容应该有效,但是没有!

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* --accept nam_pcpn_anal*/ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'

任何想法!

1 个答案:

答案 0 :(得分:0)

wget manual显示:

   -I list
   --include-directories=list
       Specify a comma-separated list of directories you wish to follow
       when downloading.  Elements of list may contain wildcards.

所以,你可以尝试:

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ \
    -A 'ST4*' -I '*/nam_pcpn_anal.*' \
    'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'