使用特定ID获取src的Web Scraping

时间:2017-02-21 11:27:45

标签: php web-scraping

我试图获取具有特定ID的a的src。 例如:

<img id="hi_1" src="url of image 1">
<img id="hi_2" src="url of image 2">
<img id="hi_3" src="url of image 3">

result = url of image 1;

我有这段代码:

$html = file_get_contents('url of site');
preg_match('here I don't know what to do', $html, $src);
$src_out = $src[1];

2 个答案:

答案 0 :(得分:1)

这将解决您的问题:)

您可以在php documentation找到更多信息。

<?php

    $html = '<img id="hi_1" src="url of image 1">
    <img id="hi_2" src="url of image 2">
    <img id="hi_3" src="url of image 3">';


        $dom = new domDocument();
        $dom->loadHTML($html);
        $dom->preserveWhiteSpace = false;
        $images = $dom->getElementsByTagName('img');
        foreach ($images as $image) {
            $img_id =  $image->getAttribute('id');

            if($img_id == 'hi_2') {
                echo $image->getAttribute('src');

            }
        }

答案 1 :(得分:0)

你正在寻找像<img id="hi_1" src="(.*)">这样的东西,但正则表达式并不是解决这个问题的正确方法。尝试使用DOM作为此问题的其他答案。