Question

im试图学习网络抓取，而我编写的代码适用于某些URL，但有些只是不获取任何HTML。当我运行脚本时，终端中显示0日志或错误，终端切换到下一个命令行。

这是我的代码，适用于某些网站，但例如，不适用于此代码：

const request = require("request");
const cheerio = require("cheerio");

request("https://reverb.com/", function (error, response, html) {
  if (!error && response.statusCode == 200) {
    console.log(html);
  }
});

终端看起来像这样，所以基本上我不获取或抓取任何html ...为什么知道为什么？

PS C:\Users\XY\Documents\Javascript\grabbercheerio> node app.js
PS C:\Users\XY\Documents\Javascript\grabbercheerio>

Answer 1

如果您的错误有价值，则说明出现了问题。然后，您要做的是记录错误并退出功能。如果错误没有值或null，则一切正常，您可以使用数据。

此示例是一种更有效的方法。

const request = require('request');

request('https://reverb.com/', function(error, _response, data) {
    if (error) {
        return console.log('Something went wrong!', error);         
    }

    // Everything went fine
    console.log(data);
});

使用Cheerio问题进行Node JS Web抓取以在某些网站上获取html

1 个答案: