Question

我基本上想抓取一个网站并显示清单

<link rel="manifest" href="/manifest.webmanifest">

并检查它。使用Javascript / Node实现此目的的最佳方法是什么？我需要哪些库，等等

Answer 1

在节点上抓取html时，有很多库可以提供帮助。我默认使用的是cheerio（https://www.npmjs.com/package/cheerio）。它有一个类似于jquery的api，因此就像

let $ = cheerio.load(...);
let $manifest_link = $('link[rel=manifest]');
let path = $manifest_link.attr('href');

// Check whether or not path == null and do something with it

之后，将该路径附加到从中获取页面的网址中，下载它（足够的库了，我自己继续使用node-fetch（https://www.npmjs.com/package/node-fetch），因为它必须具有与浏览器提取相似的API）和voila：）

下载网站清单所需的必要步骤是什么？

1 个答案: