我有一个特定的页面,我从中删除了一些数据,但为了收集更多信息,我需要关注另一个href链接来收集该特定项目的更多数据,我不知道如何。
这是我到目前为止所做的:
router.get("/:id",function(req,res){
var url = "www.someurl.com"
request(url, function (error, response, html){
if (!error && response.statusCode == 200){
$ = cheerio.load(html);
$('div.ProductDetails').each(function(){// function for details
var self = this;
var a = $(this).children().children();
details = a.attr('href');
details = {
details:details
};
这为我提供了详细信息部分的链接以及实际细节。我只需要知道如何刮擦内部。
答案 0 :(得分:1)
与第一次使用的方式相同,details.details
是<a>
代码中的网址。
所以你需要向该网址发出请求
request(details.details, function(err, res, html) { /* code */ })
然后使用cheerio提取数据。