如何查找网页中嵌入的图像和视频的数量?

时间:2017-12-14 16:39:00

标签: python html html5 web-scraping html-parsing

我正在使用newspaper library查找新闻文章中的图片和视频数量。但是,它不能很好地工作,并且其输出不可靠。

例如,对于this BBC article,我应该获得三张图片和一张视频,但它会返回7张图片和零视频。

报纸库示例:

iteritems()

我想知道是否有更好的替代品来查找新闻文章(HTML)中嵌入的图像和视频的数量?

语言:Python 3.5

0 个答案:

没有答案