下载网站清单所需的必要步骤是什么?

时间:2019-01-10 22:32:06

标签: javascript node.js web-scraping

我基本上想抓取一个网站并显示清单

<link rel="manifest" href="/manifest.webmanifest">

并检查它。使用Javascript / Node实现此目的的最佳方法是什么?我需要哪些库,等等

1 个答案:

答案 0 :(得分:0)

在节点上抓取html时,有很多库可以提供帮助。我默认使用的是cheerio(https://www.npmjs.com/package/cheerio)。它有一个类似于jquery的api,因此就像

let $ = cheerio.load(...);
let $manifest_link = $('link[rel=manifest]');
let path = $manifest_link.attr('href');

// Check whether or not path == null and do something with it

之后,将该路径附加到从中获取页面的网址中, 下载它(足够的库了,我自己继续使用node-fetch(https://www.npmjs.com/package/node-fetch),因为它必须具有与浏览器提取相似的API)和voila:)