我尝试为nodeJS构建一个非常简单的scraper函数 - 只是一个我可以传递URL的函数,它将被抓取的数据作为var data
返回。
我对Node.js完全不熟悉,并且无法理解为什么以下内容不起作用:
var request = require('request');
var cheerio = require('cheerio');
function scrape(url) {
console.log("Scraping: " + url);
request(url, function(err, resp, body) {
if (err) {
throw err;
}
var html = cheerio.load(body);
return html;
});
}
var data = scrape('http://www.stackoverflow.com');
$ = data;
var logo = $('#hlogo a').text();
console.log(logo);
上面的代码应该返回"Stack Overflow"
,但显然不会。当我在控制台中运行它时出现错误:
var logo = $('#hlogo a').text();
^
TypeError: Property '$' of object #<Object> is not a function
为什么这对我不起作用?
答案 0 :(得分:2)
您的data
将是未定义的,因为scrape
函数不返回值,另外它是异步的。
你需要改变这样的逻辑:
function scrape(url, oncomplete) {
console.log("Scraping: " + url);
request(url, function(err, resp, body) {
if (err) {
throw err;
}
var html = cheerio.load(body);
oncomplete(html);
});
}
scrape('http://www.stackoverflow.com', function(data) { /* do work here*/ });