此服务器获取谷歌第一个网站的所有链接:
var http = require('http');
var qs = require('querystring');
var request = require("request");
var cheerio = require('cheerio');
http.createServer().listen(1337, "127.0.0.1");
function parsehl(body, callback){
$ = cheerio.load(body);
var result = '';
links = $('a'); //jquery get all hyperlinks ???????
$(links).each(function(i, link){
var hyperlink = '\n'+ $(link).attr('href');
result = result + hyperlink ;
});
callback(result);}
request({uri: 'http://www.google.com/search?q=rio&start=00' }, function (error, response, body) {
console.log('url requested ') ;
if (!error){
parsehl(body, function(result){
console.log(result);
});
}
else
{
console.log(error);
}
});
此服务器按标记名称 a 获取链接。 我们需要的链接的类名称为 l (看起来像nr 1,但是很少见)。 我们如何通过类名获取链接? 我们可能只需要一行来填写问号。
答案 0 :(得分:0)
你试过了吗?
links = $('a.l');