如何从系统更改的URL下载所有带有wget的pdf?

时间:2017-05-24 14:39:09

标签: pdf download wget

我想从在线图书馆“EnriqueBolaños”(http://enriquebolanos.org)下载大量pdf wget

我想下载的第一个pdf的链接是

http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-02.pdf

所有其他pdfurl链接,后者遵循某种模式:它们具有在其中发布的日期,例如: G。

1961年1月3日:http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-03.pdf

1961年1月4日:http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-04.pdf

  1. 如何从1961年1月2日下载所有可用的pdf到 1997年12月19日与wget同时出现?

  2. 如果无法做到这一点,我如何下载所有pdf一年 在wget中的出版物,e。 G。首先是1961年的所有pdf,然后是1962年等?

  3. 到目前为止,我有这个命令,导致仅下载1961年Januar的所有可用pdf

    wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-1961-01-0{1..31}.pdf
    

    编辑:我现在有以下命令:

    wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-19{61..97}-0{1..9}-{01..31}.pdf http://sajurin.enriquebolanos.org/vega/docs/G-19{61..97}-{10..12}-{01..31}.pdf
    

    然而,wget告诉我

    Argument list too long
    

    有什么工作吗?

    我尝试了以下循环无济于事:

    for ((i=61; i<=$97; i++)) ; do wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-19$i-0{1..9}-{01..31}.pdf http://sajurin.enriquebolanos.org/vega/docs/G-19$i-{10..12}-{01..31}.pdf ; done
    

1 个答案:

答案 0 :(得分:0)

我设法找到问题的解决方案,即

for i in {61..97} ; do wget -A pdf -nc -E -nd http://sajurin.enriquebolanos.org/vega/docs/G-19$i-0{1..9}-{01..31}.pdf http://sajurin.enriquebolanos.org/vega/docs/G-19$i-{10..12}-{01..31}.pdf ; done