我正在尝试学习如何制作网络抓取工具,以及如何使用node将站点中的内容保存到文本文件中。我的问题是,要获取内容,我正在使用没有经验的cheerio和jquery(我认为吗?)。我试图将我从cheerio获得的结果转换为我有更多经验的DOM对象。如何从cheerio中获取html并将其转换为DOM对象?预先感谢!
const request = require('request');
const cheerio = require('cheerio');
request('https://www.wuxiaworld.com/novel/overgeared/og-chapter-153',(error, response, html) => {
if(!error & response.statusCode == 200) {
const $ = cheerio.load(html);
console.log(html);
html.getElementsByClassName('fr-view')[1];//I want the ability to do this
}
})
答案 0 :(得分:1)
您正在使用cheerio,那里的第一个示例向您展示了如何添加类并使用HTML获取字符串。
您可以将代码更改为如下形式:
const request = require('request');
const cheerio = require('cheerio');
request('https://www.wuxiaworld.com/novel/overgeared/og-chapter-153',(error, response, html) => {
if(!error & response.statusCode == 200) {
const $ = cheerio.load(html);
const result = $('.my-calssName').html(); // cheerio api to find by css selector, just like jQuery.
console.log(result);
}
})