我正在使用此处开发的图像抓取功能:https://github.com/morshedalam/url-scraper-php
他们正在使用此正则表达式来查找图像:
private $img_expression = '/<img[^>]+src=([\'"])?((?(1).+?|[^\s>]+))(?(1)\1)/';
这很好,然而,它会返回每个图像(包括微小图像)。很像Pinterest,Facebook等。我只对获得拇指的图像感兴趣,即宽度&gt; 200像素。我意识到图像的尺寸可能没有在html源中定义。
你会怎么做?
干杯。
答案 0 :(得分:0)
您需要下载提取的图像,获取它们的大小并选择那些足够大的图像。
有趣的是,只有这样的答案:php get all the images from url which width and height >=200 more quicker