wget从检索到的文件下载图像

时间:2013-03-04 05:37:50

标签: download wget

我有一个我需要检索的文件,然后我需要浏览该文件并下载列出的所有图像。格式为xml,但我不想使用xml解析器。

当我使用

sudo wget --restrict-file-names=windows -nH -nd -r -i -P images \ -A jpeg,jpg,gif,png https://url.com/api/ojgnvhy75hGvcf36dnJO0947bsh62gbs?_=1361842359357 

我下载了xml文件,但我需要该文件中引用的图像。

我在这里做错了什么?

1 个答案:

答案 0 :(得分:0)

我最终得到以下代码,获取xml文件并将其保存到文本,然后我使用sed从文本文件中获取链接并将其写入另一个文件,然后使用该文件上的wget下载图像。

#!/bin/dash

wget -O xml.txt 'https://url_to_download_from' 
links=$(sed -n "/image>/s/^   .\([^>]*\)<\/image>.*/\1/gpw links.txt" xml.txt)
wget -N  -P images -A png -i $links 

可悲的是,即使我只请求图片,这也会产生一堆不是图像的文件。

完成此脚本后,我运行以下命令来清理文件夹。

cd images
shopt -s extglob nocaseglob
rm !(*.png)