Question

我正在尝试从此网站（http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/）下载一些特定文件，它们会保留10天的数据。我想下载以＆＃34; ST4＆＃34;开头的所有文件。来自＆＃34; nam_pcpn_anal＆＃34;开头的所有目录。我可以下载所有盯着＆＃34; ST4＆＃34;的文件从一个文件夹，如：

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/nam_pcpn_anal.20160625/'

但我不知道如何递归搜索ST4。我认为下面的内容应该有效，但是没有！

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ -A ST4* --accept nam_pcpn_anal*/ST4* 'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'

任何想法！

Answer 1

wget manual显示：

   -I list
   --include-directories=list
       Specify a comma-separated list of directories you wish to follow
       when downloading.  Elements of list may contain wildcards.

所以，你可以尝试：

wget -r -nd -N --no-parent -nH --cut-dirs=100 -P ~/test/ \
    -A 'ST4*' -I '*/nam_pcpn_anal.*' \
    'http://nomads.ncep.noaa.gov/pub/data/nccf/com/hourly/prod/'

如何使用wget

1 个答案: