使用Cheerio

时间:2016-06-05 09:58:10

标签: node.js web-scraping cheerio

如何使用cheerio提取主文本? 我希望去不知名的网站,只需使用nodeJS和Cheerio即可获得正文(或所有文字)。

2 个答案:

答案 0 :(得分:0)

使用名为boilerpipe的npm moudle解决了

答案 1 :(得分:0)

使用请求库,您将获得HTML文本。检查站点以查看它是否未使用Virtual DOM或Shadow DOM即。反应。如果是,Cheerio的方法不起作用,你会得到一个无法使用的圆形物体。