我正在尝试使用以下代码从此网站路径 http://www.samsung.com/sg/consumer/mobile-devices/smartphones/ 下载所有图片
wget -e robots=off -nd -nc -np --recursive -r -p --level=5 --accept jpg,jpeg,png,gif --convert-links -N --limit-rate=200k --wait 1.0 -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:14.0) Gecko/20100101 Firefox/14.0.1' -P testing_folder www.samsung.com/sg/consumer/mobile-devices/smartphones
我希望看到手机的图像下载到我的testing_folder.But所有我看到的是一些全球图像,如徽标等。我似乎无法下载手机图像。上面的代码似乎可以在其他一些网站上使用。
我已经浏览了这个论坛上的所有问题,但这个特殊问题似乎没有答案。有人可以帮助,我相信有一个容易出局。我做错了什么?
更新: 它看起来像是一个可能的javascript页面的问题,因此看起来像路的结束,因为显然wget无法很好地处理javascript页面。如果任何人仍然可以提供帮助,将会很高兴。
答案 0 :(得分:1)
步骤:
配置代理服务器,例如Apache httpd with mod_proxy和mod_http_proxy
使用支持JavaScript的网络浏览器访问该页面并配置为使用您的代理服务器
从代理服务器日志文件中获取URL并将其放入文件
或者:
启动Firefox并打开网页
F10 - 工具 - 页面信息 - 媒体 - 右键单击 - 全选 - 右键单击 - 复制
使用您喜欢的编辑器粘贴到文件中
然后:
可选地,(如果您不想知道如何让wget从文件中读取URL列表),请将最小的html标签(html,body和img)添加到文件中
使用wget下载指定在步骤3或4中创建的文件作为起点的图像