PHP简单的HTML DOM解析器 - 循环

时间:2017-09-24 19:12:23

标签: php parsing html-parsing simple-html-dom html-parser

我开始玩Simple Simple Doom Parser,但我遇到了一些麻烦:

HTML代码如下:

<div class="players">
    <ul class="dane">
        <li>
            <div class="name">Messi</div>
            <div class="value">Barcelona</div>
        </li>
        <li>
            <div class="name">Ronaldo</div>
            <div class="value">Madryt</div>
        </li>
    </ul>
</div>

<div class="clubs">
    <ul class="dane">
        <li>
            <div class="name">Barcelona</div>
            <div class="value">Hiszpania</div>
        </li>
        <li>
            <div class="name">Madryt</div>
            <div class="value">Hiszpania</div>
        </li>
    </ul>
</div>

<div class="trenerzy">
    <ul class="dane">
        <li>
            <div class="name">Ernesto Valverde</div>
            <div class="value">Barcelona</div>
        </li>
        <li>
            <div class="name">Madryt</div>
            <div class="value">Zidane</div>
        </li>
    </ul>
</div>

我的PHP代码:

include_once('simple_html_dom.php');
$html = file_get_html('http://');

$articles = array();
foreach($html->find('ul.dane') as $article) {
    $item['name']     = $article->find('div.name',0)->plaintext;
    $item['value']    = $article->find('div.value',0)->plaintext;
    $articles[] = $item;
}

print_r($articles);

收到的数据是:

Array
(
    [0] => Array
        (
            [name] =>                   Messi               
            [value] =>                      Barcelona               
        )

    [1] => Array
        (
            [name] =>                   Barcelona               
            [value] =>                      Hiszpania               
        )

    [2] => Array
        (
            [name] =>                   Ernesto Valverde                
            [value] =>                      Barcelona               
        )

它从数据类ul.dane接收数据但只有1条记录,如何获取页面上的所有内容?

我知道我在某个地方错过了一个循环,但我找到了一个问题

1 个答案:

答案 0 :(得分:0)

你可能想要

  1. 查找所有ul.dane元素
  2. 在每个ul内搜索li元素
  3. 在每个li中搜索div.namediv.value元素
  4. 在这种情况下,代码的问题在于您忘记在每个li内找到每个ul元素,这将是第2步。试试这个:

    foreach($html->find('ul.dane') as $ul) {
        foreach($ul->find('li') as $article){
            $item['name']     = $article->find('div.name',0)->plaintext;
            $item['value']    = $article->find('div.value',0)->plaintext;
            $articles[] = $item;
        }
    }