使用wget从网站下载并保存图像

时间:2015-05-13 21:47:53

标签: command-line windows-7 wget

如何使用wget从以下网页下载并保存特定图像。

http://www-nass.nhtsa.dot.gov/nass/cds/GetBinary.aspx?SceneView&ImageID=509617654

我尝试了this

 "C:\Program Files (x86)\GnuWin32\bin\wget" -r -P "C:\temp\" -A jpeg,jpg,bmp,gif,png "http://www-nass.nhtsa.dot.gov/nass/cds/GetBinary.aspx?SceneView&ImageID=509617654"

但图片没有下载和保存。我正在使用Windows 7.我想我没有得到图像,因为网页不是一个合适的html页面(没有html或asp等扩展名)。我对么?

1 个答案:

答案 0 :(得分:0)

不完全是。包含HTML的网址(例如http://google.com/)不需要文件扩展名。

通过检查HTML源代码(忽略该页面包含无效的HTML(<script><head>之间的<body>标记)),我们可以看到它使用JavaScript来将图片的页面加载src属性(为什么,谁知道......)更改为/GetBinary.aspx?Scene&ImageID=509617654&CaseID=&Version=(相对于HTML页面)。

由于 wget无法执行JS ,因此无法使用(如此)。

然而,actual image URL确实返回了JPEG图像,但您必须重命名它,因为Web服务器(IIS)配置错误,因为该URL返回标题:< / p>

Content-Type: E:\Sites\NASS\CDS\/img/jpg

无效,在大多数浏览器/客户端下载时会导致文件关联问题。

要证明它,您可以尝试使用wget直接下载:

wget "http://www-nass.nhtsa.dot.gov/nass/cds/GetBinary.aspx/GetBinary.aspx?Scene&ImageID=509617654&CaseID=&Version=" -O image.jpg