Cheerio Web Scrape如何在webscrape内部进行webscrape

时间:2016-02-25 18:21:30

标签: javascript node.js web-scraping cheerio

我有一个特定的页面,我从中删除了一些数据,但为了收集更多信息,我需要关注另一个href链接来收集该特定项目的更多数据,我不知道如何。

这是我到目前为止所做的:

       router.get("/:id",function(req,res){
       var url = "www.someurl.com"

       request(url, function (error, response, html){
       if (!error && response.statusCode == 200){
        $ = cheerio.load(html);

       $('div.ProductDetails').each(function(){// function for details
          var self = this;
          var a = $(this).children().children();
          details = a.attr('href');

          details = {
          details:details
      };

这为我提供了详细信息部分的链接以及实际细节。我只需要知道如何刮擦内部。

1 个答案:

答案 0 :(得分:1)

与第一次使用的方式相同,details.details<a>代码中的网址。

所以你需要向该网址发出请求

request(details.details, function(err, res, html) { /* code */ })

然后使用cheerio提取数据。