我编写了一个小节点应用程序,它将使用puppeteer和Headless Chrome对其网站的二手CSS进行抓取。
除了一件事情外,它还很不错:它没有抢@media
规则?
const puppeteer = require('puppeteer');
const util = require('util');
const fs = require("fs");
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.coverage.startCSSCoverage();
await page.goto('http://localhost');
await page.setViewport({width : 320, height : 640});
const css_coverage = await page.coverage.stopCSSCoverage();
console.log(util.inspect(css_coverage, { showHidden: false, depth: null }));
await browser.close();
let final_css_bytes = '';
let total_bytes = 0;
let used_bytes = 0;
for (const entry of css_coverage) {
final_css_bytes = "";
total_bytes += entry.text.length;
for (const range of entry.ranges) {
used_bytes += range.end - range.start - 1;
final_css_bytes += entry.text.slice(range.start, range.end) + '\n';
}
filename = entry.url.split('/').pop();
fs.writeFile('./'+filename, final_css_bytes, error => {
if (error) {
console.log('Error creating file:', error);
} else {
console.log('File saved');
}
});
}
})();
当页面上有很多规则时,没有人知道为什么@media
规则不包含在最终输出中吗?
答案 0 :(得分:1)
我相信这是铬本身的行为。如果您检查了chrome dev工具的代码覆盖率,则使用的css将不包含媒体查询的定义。仅实际的选择器可用。
这同样适用于字体和关键帧。甚至还有issue in chromium用于字体。
要提取页面中使用的CSS,您可以查看类似minimalcss
答案 1 :(得分:0)
我将其报告为Chrome中的错误,并将其移至Chromium:
https://bugs.chromium.org/p/chromium/issues/detail?id=983887
希望很快会添加此功能。