wget并行下载文件并重命名

时间:2018-07-29 16:38:26

标签: bash unix

我有一个包含两列的文本文件:第一列是要另存为的名称,第二列是资源的网址。

10000899567110806314.jpg 'http://lifestyle.inquirer.net/files/2018/07/t0724cheekee-marcopolo_1-e1532358505274-620x298.jpg'
10001149035013559957.jpg 'https://www.politico.eu/wp-content/uploads/2018/07/GettyImages-1004567890.jpg'
10001268622353586394.jpg 'http://www.channelnewsasia.com/image/10549912/16x9/991/529/a7afd249388308118058689b0060a978/Zv/tour-de-france-5.jpg'
10001360495981714191.jpg 'https://media.breitbart.com/media/2018/07/Dan-Coats.jpg'

该文件包含数千行,因此我希望有一种快速的方法来下载和重命名这些图像。

我阅读了SO上的多个帖子,并提出了以下解决方案:

cat list.txt  | xargs -n 1 -P 4 -d '\n' wget -O 

使用xargs并行下载。我想使用wget-O选项来重命名下载的文件。当我运行单个wget命令时,这很好。示例:

wget -O 10000899567110806314.jpg 'http://lifestyle.inquirer.net/files/2018/07/t0724cheekee-marcopolo_1-e1532358505274-620x298.jpg'

但是在运行带有xargs的命令以并行下载时,出现此错误:

Try `wget --help' for more options.
wget: missing URL
Usage: wget [OPTION]... [URL]...

如果我生成的文件仅包含(单行)换行符分隔的URL并运行以下命令,则效果很好。

cat list.txt  | xargs -n 1 -P 4 -d '\n' wget

但是,我不想先下载文件然后再执行重命名操作。

1 个答案:

答案 0 :(得分:2)

您得到的错误是因为您仅传递了一个参数-n 1才能使其正常工作,您需要传递2个参数,请尝试以下操作:

cat list.txt | xargs -n 2 -P 4 wget -O

要将实线用作@Pesa作为参数,建议您可以使用选项-L 1,例如:

xargs < list.txt -P 4 -L 1 wget -O

从男人那里来

 -L number
     Call utility for every number non-empty lines read. 
     A line ending with a space continues to the next non-empty line. 
     If EOF is reached and fewer lines have been read than number then utility 
     will be called with the available lines.  The -L and -n options are
     mutually-exclusive; the last one given will be used.