我基本上想抓取一个网站并显示清单
<link rel="manifest" href="/manifest.webmanifest">
并检查它。使用Javascript / Node实现此目的的最佳方法是什么?我需要哪些库,等等
答案 0 :(得分:0)
在节点上抓取html时,有很多库可以提供帮助。我默认使用的是cheerio(https://www.npmjs.com/package/cheerio)。它有一个类似于jquery的api,因此就像
let $ = cheerio.load(...);
let $manifest_link = $('link[rel=manifest]');
let path = $manifest_link.attr('href');
// Check whether or not path == null and do something with it
之后,将该路径附加到从中获取页面的网址中, 下载它(足够的库了,我自己继续使用node-fetch(https://www.npmjs.com/package/node-fetch),因为它必须具有与浏览器提取相似的API)和voila:)