PHP简单的html dom提取某些img

时间:2016-02-23 12:45:02

标签: php html dom web-scraping

任何有PHP简单html dom解析器的知识的人? 我在Php simple html dom parser

上阅读了文档

我试图做的事情是在页面源上找到包含drupal-images的特定img url。例如:     “http://drupal- images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601- 42562915-273368722d35758cde85a1320a6bb23b.jpeg”

并且只找到包含单词的图像:drupal-images。这可能吗?。

到目前为止,我唯一能做的就是从页面中提取所有图像,就像这样。

include("simplehtmldom_1_5/simple_html_dom.php");

$html = file_get_html("http://www.tv2.dk");
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';

如果您应该找到某些图像.... 你会在foreach中使用reqular表达式吗?

我可以找到元吗?像这样:           meta name =“Generator”content =“Drupal 7(http://drupal.org

我搜索了很多,似乎我只能找到特定的div和类。

提前致谢。

1 个答案:

答案 0 :(得分:1)

简单strpos()可以帮助您:

    $str = 'drupal-images';
    $url = 'http://drupal-images.tv2.dk/sites/images.tv2.dk/files/t2img/2016/02/22/480x270/227713601-42562915-273368722d35758cde85a1320a6bb23b.jpeg';
    $urlArray = explode('/',$url);
    if(strpos($url, $str) > 0){
        $img = end($urlArray);
    }

我相信您可以在代码中找到如何使用此示例。

重新获取元数据,您可以使用exif_read_meta(),可在此处找到更多内容:http://php.net/manual/en/function.exif-read-data.php