标签: node.js web-scraping cheerio
如何使用cheerio提取主文本? 我希望去不知名的网站,只需使用nodeJS和Cheerio即可获得正文(或所有文字)。
答案 0 :(得分:0)
使用名为boilerpipe的npm moudle解决了
答案 1 :(得分:0)
使用请求库,您将获得HTML文本。检查站点以查看它是否未使用Virtual DOM或Shadow DOM即。反应。如果是,Cheerio的方法不起作用,你会得到一个无法使用的圆形物体。