网站抓取者使用srcset值以及src获取图像

时间:2020-04-22 15:55:27

标签: javascript web-scraping

我正在使用网站抓取工具为我正在处理的节点应用程序制作一些静态模板。我似乎无法获得具有srcset值的图像,网站抓取工具会更新src值,而不是srcset值。我需要在来源中传递另一个值吗?

1 个答案:

答案 0 :(得分:1)

根据github issue的回答,如果您的html包含

之类的标记,则sources选项应包含{ selector: 'img', attr: 'srcset' }规则
<img srcset="/2x.jpg 2x, /1x.jpg 1x" src="/fallback.jpg" >

例如:

const options = {
  urls: 'http://example.com',
  directory: '/path/to/save/',
  sources: [
    { selector: 'img', attr: 'srcset' }
  ]
};