使用python计算网页上传/有效图像的数量

时间:2018-06-08 07:37:12

标签: python image request html-parsing

我需要统计网页上的上传/有效图片。

我有下面的脚本来计算页面上的所有img标签...但我只需要获得实际上传的图像的结果。如果那是有道理的。

因此,如果我有一个包含200个img标签的页面,但实际只上传了50个图像,我想得到50个结果。

How to count the images that are not loaded

from lxml import etree
import requests


def get_img_cnt(url):
    response = requests.get(url)
    parser = etree.HTMLParser()
    root = etree.fromstring(response.content, parser=parser)

return int(root.xpath('count(//img)'))


print(get_img_cnt('http://www.americascup.com/en/schedules/races'))

代码来源:count the number of images on a webpage, using urllib

0 个答案:

没有答案