Question

我有一个特定的页面，我从中删除了一些数据，但为了收集更多信息，我需要关注另一个href链接来收集该特定项目的更多数据，我不知道如何。

这是我到目前为止所做的：

       router.get("/:id",function(req,res){
       var url = "www.someurl.com"

       request(url, function (error, response, html){
       if (!error && response.statusCode == 200){
        $ = cheerio.load(html);

       $('div.ProductDetails').each(function(){// function for details
          var self = this;
          var a = $(this).children().children();
          details = a.attr('href');

          details = {
          details:details
      };

这为我提供了详细信息部分的链接以及实际细节。我只需要知道如何刮擦内部。

Answer 1

与第一次使用的方式相同，details.details是<a>代码中的网址。

所以你需要向该网址发出请求

request(details.details, function(err, res, html) { /* code */ })

然后使用cheerio提取数据。

Cheerio Web Scrape如何在webscrape内部进行webscrape

1 个答案: