我正在尝试下载以下漫画:
http://comicsbook.ru/upload/Комикс-Amazing-Super-Powers-Минутка-наркомании-81619.jpg
对不起,网址,但它只是图像。您可以在浏览器中轻松查看,甚至可以通过浏览器下载,但如果我wget
这个网址,我会获得HTML页面,而不是图片。我做错了什么?我也试过perl下载模块。结果相同。
答案 0 :(得分:1)
这意味着默认内容类型为 text / html。 您必须通过相应库的 setContentType()方法设置所需的内容类型。这是java
中的一个例子HttpGet request = new HttpGet(URL);
request.addHeader("accept", "image/jpeg");
答案 1 :(得分:1)
如果请求中未设置引用者,则服务器将重定向(301)到网页 我能够通过标题中的referer获取jpg图像:http://comicsbook.ru/funny/81619?minutka-narkomanii
wget --referer="http://comicsbook.ru/funny/81619?minutka-narkomanii" http://comicsbook.ru/upload/Комикс-Amazing-Super-Powers-Минутка-наркомании-81619.jpg