最小宽度图像刮刀

时间:2013-11-17 20:33:44

标签: php web-scraping

我正在使用此处开发的图像抓取功能:https://github.com/morshedalam/url-scraper-php

他们正在使用此正则表达式来查找图像:

private $img_expression = '/<img[^>]+src=([\'"])?((?(1).+?|[^\s>]+))(?(1)\1)/';

这很好,然而,它会返回每个图像(包括微小图像)。很像Pinterest,Facebook等。我只对获得拇指的图像感兴趣,即宽度&gt; 200像素。我意识到图像的尺寸可能没有在html源中定义。

你会怎么做?

干杯。

1 个答案:

答案 0 :(得分:0)

您需要下载提取的图像,获取它们的大小并选择那些足够大的图像。

有趣的是,只有这样的答案:php get all the images from url which width and height >=200 more quicker