使用Cheerio问题进行Node JS Web抓取以在某些网站上获取html

时间:2020-04-30 08:51:49

标签: javascript node.js web-scraping request cheerio

im试图学习网络抓取,而我编写的代码适用于某些URL,但有些只是不获取任何HTML。当我运行脚本时,终端中显示0日志或错误,终端切换到下一个命令行。

这是我的代码,适用于某些网站,但例如,不适用于此代码:

const request = require("request");
const cheerio = require("cheerio");

request("https://reverb.com/", function (error, response, html) {
  if (!error && response.statusCode == 200) {
    console.log(html);
  }
});

终端看起来像这样,所以基本上我不获取或抓取任何html ...为什么知道为什么?

PS C:\Users\XY\Documents\Javascript\grabbercheerio> node app.js
PS C:\Users\XY\Documents\Javascript\grabbercheerio>

1 个答案:

答案 0 :(得分:0)

如果您的错误有价值,则说明出现了问题。然后,您要做的是记录错误并退出功能。如果错误没有值或null,则一切正常,您可以使用数据。

此示例是一种更有效的方法。

const request = require('request');

request('https://reverb.com/', function(error, _response, data) {
    if (error) {
        return console.log('Something went wrong!', error);         
    }

    // Everything went fine
    console.log(data);
});