使用curl下载Amazon网页时遗漏的部分

时间:2013-08-22 23:02:21

标签: curl web-scraping

我有一个程序可以下载此亚马逊网页:http://www.amazon.com/mobile-apps/b?ie=UTF8&node=2350149011

然后解析它并在我写的一个小GUI中以一种很好的格式向我显示信息。 无论如何,这个程序已经工作了几个月,直到今天。因此经过一些故障排除我发现这是因为curl不再下载整个网页了。谁能告诉我为什么?

这是我使用的命令:

curl 'http://www.amazon.com/mobile-apps/b?ie=UTF8&node=2350149011' > localpage

这是一张图片,因为一张图片胜过千言万语。嗯,这就是他们所说的。

enter image description here

1 个答案:

答案 0 :(得分:1)

只需设置用户代理即可解决此问题。 看起来应该是这样的:

curl -A "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit (KHTML, like Gecko) Chrome" 'http://www.amazon.com/mobile-apps/b?ie=UTF8&node=2350149011' > localpage

希望这有帮助。