我需要统计网页上的上传/有效图片。
我有下面的脚本来计算页面上的所有img
标签...但我只需要获得实际上传的图像的结果。如果那是有道理的。
因此,如果我有一个包含200个img标签的页面,但实际只上传了50个图像,我想得到50个结果。
from lxml import etree
import requests
def get_img_cnt(url):
response = requests.get(url)
parser = etree.HTMLParser()
root = etree.fromstring(response.content, parser=parser)
return int(root.xpath('count(//img)'))
print(get_img_cnt('http://www.americascup.com/en/schedules/races'))