我有以下问题:
我想用wget在网页上下载所有图片。通常我可以用
来做到这一点wget -nd -r -P ./ -A jpeg,jpg,bmp,gif,png somepage.com
但问题是,我的网页上的图片是从PHP
脚本加载的,因此无法下载它们。 PHP
似乎有效,因为每个图片都有自己的ID,脚本(称为file.php
)获取ID(file.php?id=someID
)并重定向到
/files/.jpg
任何想法如何解决这个问题?
- dunklesToast
答案 0 :(得分:0)
我更喜欢使用--page-requisites(简称-p)而不是-r here,因为它下载了页面需要显示的所有内容但没有其他页面,我不必考虑什么样的我想要的文件。
实际上我通常会使用像
这样的东西wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter
这意味着:
-E:如果文件名是HTML文件,则将.html附加到文件名但不以.html或类似方式结尾 -H:也从其他主机下载文件 -k:下载后转换其中的任何链接,以便指向下载的文件 -p:下载页面所需的任何内容,以便正确离线查看 或者你可以试试像
这样的东西wget -p www.example.com/index.html
但是,我猜它不能做一些聪明的事情(涉及javascript)。这取决于您的页面。