标签: python html html5 web-scraping html-parsing
我正在使用newspaper library查找新闻文章中的图片和视频数量。但是,它不能很好地工作,并且其输出不可靠。
例如,对于this BBC article,我应该获得三张图片和一张视频,但它会返回7张图片和零视频。
报纸库示例:
iteritems()
我想知道是否有更好的替代品来查找新闻文章(HTML)中嵌入的图像和视频的数量?
语言:Python 3.5