使用DOMdocument和getElementByTagName函数从网页中提取img标记

时间:2017-01-11 14:41:21

标签: php html domdocument getelementsbytagname

我从我的WP网站的网页中提取源代码。我要推断每个标签。该页面是产品详细信息,我修改了woocommerceprintproduct插件的代码。 我在插件代码中添加了以下代码:

$dom = new DOMDocument();
libxml_use_internal_errors(true);
$dom->loadHTMLFile("http://www.pecso.it/prodotto/741drinkflex-piatto-nondiv/");
var_dump($dom); 
$imgTags = $dom->getElementsByTagName("img");
var_dump($imgTags);

打印$imgTags我获得以下值: object(DOMNodeList)#20572 (1) { ["length"]=> int(34) }

现在,我可以提取每个<img>代码吗?

1 个答案:

答案 0 :(得分:0)

    $images_links = [];$i=0;
    $img_tags = $dom->getElementsByTagName('img');
    if (!is_null($img_tags)) {
       foreach ($img_tags as $img_tag) {
           if ($img_tag->hasAttribute('src')) {
               $src_value = $img_tag->getAttribute('src');
               $images_links[$i] = $src_value;
               $i++;
            }
       }
   }

这样你可以获得属性等等