wget试图从某些网站获取图像的问题

时间:2015-06-17 17:47:50

标签: bash wget

我正在尝试使用以下代码从此网站路径 http://www.samsung.com/sg/consumer/mobile-devices/smartphones/ 下载所有图片

wget -e robots=off -nd -nc -np --recursive -r -p --level=5 --accept jpg,jpeg,png,gif --convert-links -N --limit-rate=200k --wait 1.0 -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:14.0) Gecko/20100101 Firefox/14.0.1' -P testing_folder  www.samsung.com/sg/consumer/mobile-devices/smartphones

我希望看到手机的图像下载到我的testing_folder.But所有我看到的是一些全球图像,如徽标等。我似乎无法下载手机图像。上面的代码似乎可以在其他一些网站上使用。

我已经浏览了这个论坛上的所有问题,但这个特殊问题似乎没有答案。有人可以帮助,我相信有一个容易出局。我做错了什么?

更新: 它看起来像是一个可能的javascript页面的问题,因此看起来像路的结束,因为显然wget无法很好地处理javascript页面。如果任何人仍然可以提供帮助,将会很高兴。

1 个答案:

答案 0 :(得分:1)

步骤:

  1. 配置代理服务器,例如Apache httpd with mod_proxy和mod_http_proxy

  2. 使用支持JavaScript的网络浏览器访问该页面并配置为使用您的代理服务器

  3. 从代理服务器日志文件中获取URL并将其放入文件

  4. 或者:

    1. 启动Firefox并打开网页

    2. F10 - 工具 - 页面信息 - 媒体 - 右键单击​​ - 全选 - 右键单击​​ - 复制

    3. 使用您喜欢的编辑器粘贴到文件中

    4. 然后:

      1. 可选地,(如果您不想知道如何让wget从文件中读取URL列表),请将最小的html标签(html,body和img)添加到文件中

      2. 使用wget下载指定在步骤3或4中创建的文件作为起点的图像