如何使用file_get_html查找HTML元素

时间:2016-05-04 10:01:08

标签: php html parsing html-parsing

使用库simple_html_dom.php

$html = file_get_html($link);

在这样的结构中

<div class="ps">    
    <h3>Lorem ipsum 1</h3>
    <p>Lorem ipsum 2</p>    
    <h3>Lorem ipsum 3</h3>
    <p>Lorem ipsum 4</p>
    <div class="extras250">
        <div class="boxType3 naSkroty">
            <div class="boxBody shortList">
                <h3>Lorem ipsum 5</h3>                
            </div>
        </div>
        <div class="boxType4 wsparcie">
            <div class="boxBody">
                <h3>Lorem ipsum 6</h3>
                <p>Lorem ipsum 7</p>                
            </div>
        </div>
    </div>
</div>


foreach ($html->find('.ps h3') as $naglowek) {
     $info['naglowek'][$i] = $naglowek->plaintext;
     $i++;
     }

我想找<h3>,但只能找到第一级(不是嵌套),而是找到所有这些。这该怎么做 ?我试过了

foreach ($html->find('.ps > h3') as $naglowek)

但不起作用。

1 个答案:

答案 0 :(得分:0)

不确定,但检查一次

foreach ($html->find('.ps > h3:first') as $naglowek)