我正在尝试使用Cheerio和Node.js请求库来检索有关图像的元数据。看起来当我向以.jpg,.png等结尾的URL发出HTTP GET请求时,它将发回整个文件,我无法访问响应中的HTML。所以,我的问题是,给定图像的URL,如何只读取HTML或元数据,而不是在向URL请求时下载整个图像文件?
例如,这里有一些简单的代码:
var request = require('request');
var cheerio = require('cheerio'); // cheerio is just used to parse HTML on the server, like jquery for the server
request('http://l.yimg.com/os/mit/media/m/content_index/images/sidekick_tv_news-2e9c408.png',function(err,response,body){
var $ = cheerio.load(body);
//here it seems like the body is not HTML but all the data pertaining to the image itself - I just want the typical HTML response, not a picture file
});
有谁知道我在说什么?
答案 0 :(得分:1)
对于初学者,您可以在img元素中使用图片网址:
var img = cheerio('<img src="' + imageUrl + '"></img>');
或
var img = cheerio.load('<img src="' + imageUrl + '"></img>');
然后您可以执行查询