我正在使用Node.js和jsdom来查找和下载页面上的所有css / js / images,然后将url重写为相对的(如wget -page-requisites --convert-links) 。但我想知道如果jsdom已经获取资源,我是否还要做所有工作。如果我打开FetchExternalResources,那么jsdom对它们做了什么?它们存储在内存中我可以将它们保存到磁盘吗?
require('jsdom').defaultDocumentFeatures = {
FetchExternalResources : ['script', 'css', 'link', 'img'],
ProcessExternalResources : true,
MutationEvents : false,
QuerySelector : false
}
答案 0 :(得分:1)
jsdom目前只提取javascript并将其保存在内存中。如果您想要获取其他资产,则需要烘焙该功能。例如:doc.getElementsByTagName('img')
,循环遍历,获取并将图像存储到磁盘。