wget从自定义网站下载PHP加载的所有图像

时间:2016-08-24 12:15:23

标签: php linux macos operating-system wget

我有以下问题:

我想用wget在网页上下载所有图片。通常我可以用

来做到这一点
wget -nd -r -P ./ -A jpeg,jpg,bmp,gif,png somepage.com

但问题是,我的网页上的图片是从PHP脚本加载的,因此无法下载它们。 PHP似乎有效,因为每个图片都有自己的ID,脚本(称为file.php)获取ID(file.php?id=someID)并重定向到

  

/files/.jpg

任何想法如何解决这个问题?

- dunklesToast

1 个答案:

答案 0 :(得分:0)

我更喜欢使用--page-requisites(简称-p)而不是-r here,因为它下载了页面需要显示的所有内容但没有其他页面,我不必考虑什么样的我想要的文件。

实际上我通常会使用像

这样的东西
wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

这意味着:

-E:如果文件名是HTML文件,则将.html附加到文件名但不以.html或类似方式结尾 -H:也从其他主机下载文件 -k:下载后转换其中的任何链接,以便指向下载的文件 -p:下载页面所需的任何内容,以便正确离线查看 或者你可以试试像

这样的东西
wget -p www.example.com/index.html

但是,我猜它不能做一些聪明的事情(涉及javascript)。这取决于您的页面。