检索图像的HTML元数据而不是下载图像

时间:2015-10-03 06:36:31

标签: javascript jquery html node.js cheerio

我正在尝试使用Cheerio和Node.js请求库来检索有关图像的元数据。看起来当我向以.jpg,.png等结尾的URL发出HTTP GET请求时,它将发回整个文件,我无法访问响应中的HTML。所以,我的问题是,给定图像的URL,如何只读取HTML或元数据,而不是在向URL请求时下载整个图像文件?

例如,这里有一些简单的代码:

    var request = require('request');
    var cheerio = require('cheerio'); // cheerio is just used to parse HTML on the server, like jquery for the server


    request('http://l.yimg.com/os/mit/media/m/content_index/images/sidekick_tv_news-2e9c408.png',function(err,response,body){

        var $ = cheerio.load(body);

        //here it seems like the body is not HTML but all the data pertaining to the image itself - I just want the typical HTML response, not a picture file


        });

有谁知道我在说什么?

1 个答案:

答案 0 :(得分:1)

对于初学者,您可以在img元素中使用图片网址:

var img = cheerio('<img src="' + imageUrl + '"></img>');

var img = cheerio.load('<img src="' + imageUrl + '"></img>');

然后您可以执行查询