使用DOMDocument& PHP中的loadHTML,用于查找标记的类

时间:2014-08-15 17:57:49

标签: php html dom

我想获得OL标签中具有“bananas”类的所有LI标签,例如,如果HTML看起来像:

<ol class="pluots plums grapes">
    <li>back to the future 2</li>
    <li>lemon bars</li>
</ol>

<ol class="walnuts bananas cornbread">
    <li>mustard</li>
    <li>ketchup</li>
</ol>

我希望能够得到芥末和芥末只有番茄酱。

所以这里:

@$doc->loadHTML($html);
$ols = $doc->getElementsByTagName('ol');
  foreach ($ols as $ol) {
     echo "<br/>". $ol->nodeName. ": ";
     $nodes = $ol->childNodes;
     foreach ($nodes as $node) {
          echo $node->nodeValue. "\n";
    }
}

会得到我所有的LI,但我想只获得OL中有“香蕉”课程的那些?

通过这样做,我可以笨拙地获得类名:

foreach ($ol->attributes as $attr) {
    $value = $attr->nodeValue;
}

我只是希望能够为OL调用类,所以我认为它会是这样的:

$class=$ol->attributes->[????]->nodeValue to get the class but I can't seem to figure it out.

我需要能够按类选择,因为有时候这些OL会有不同的顺序。

1 个答案:

答案 0 :(得分:1)

在循环浏览它们时,请检查class属性的值,看它是否包含bananas

<?
$html = <<<HTML
<ol class="pluots plums grapes">
    <li>back to the future 2</li>
    <li>lemon bars</li>
</ol>

<ol class="walnuts bananas cornbread">
    <li>mustard</li>
    <li>ketchup</li>
</ol>
HTML;

$doc = new DOMDocument();
$doc->loadHTML($html);
$ols = $doc->getElementsByTagName('ol');

foreach ($ols as $ol) {
    $classes = $ol->getAttribute('class');

    if (strpos($classes, 'bananas') !== false) {
        $nodes = $ol->getElementsByTagName('li');

        foreach ($nodes as $node) {
              echo trim($node->nodeValue)."\n";
        }   
    }   
}

打印出来:

mustard
ketchup

关于您的第二个问题,MDN HTML Reference以及MDN DOM Reference都非常完整。