为什么DomDocument getElementsByTagName会返回一半NodeList?

时间:2011-04-01 14:47:13

标签: php xhtml domdocument getelementsbytagname

我使用DomDocument生成一些非标准标记HTML,结果如下:

/* Input HTML
  <div id="toobar_top">
    <widget id="flag_holder"></widget>
    <widget id="horizontal_menu"></widget>
  </div>
  <div id="header">
    <widget name="header"></widget>
  </div>
*/

我想要做的是将每个小部件“翻译”成有用的东西......它们是带有参数的简单占位符。

该类的函数摘录是:

private function widgeter($doc) { //Give it an DomDocument HTML containing <widget> elements and will translate them into usable stuff
    $this->_widgetList = $doc->getElementsByTagName($this->_widgetTransformTo);
    foreach ($this->_widgetList as $widget) {
        $data = array();
        if ($widget->hasAttributes()) {
        foreach ($widget->attributes as $attribute) {
            $data[][$attribute->name] = $attribute->value;
            // @TODO: Implements Widget Transformation

        }
        }
        // Next 2 lines are just for debug
        $string = serialize($data);
        $newWidget = $doc->createElement('p', $string);
        $widget->parentNode->replaceChild($newWidget, $widget);
    }
    return $doc;
    }

然后当我保存HTML()$ doc时,我看到了:

/* Output HTML
  <div id="toobar_top">
    <p>[{"id":"flag_holder"}]</p>
    <widget id="horizontal_menu"></widget>
  </div>
  <div id="header">
    <p>[{"id":"header"}]</p>
  </div>
*/

为什么“horizo​​ntal_menu”没有被翻译?

小部件的位置并不重要(我尝试只使用一个包含所有小部件的div,每个小部件使用div)。

我无法弄明白......

2 个答案:

答案 0 :(得分:8)

之所以发生这种情况,是因为您在循环它们的同时替换DOMNodeList中的元素。 DOMNodeList不是数组,因此foreach 不会在副本上运行,而是在对象本身上运行。

基本上,我认为正在发生的事情是:

  • 您替换<widget>的第一个实例(第0项)。
  • 指针前进到下一个项目(第1项)。
  • 项目0已被替换,不再存在。
  • 发生项目转移:项目1变为项目0,项目2变为项目1。
  • 指针仍然指向第1项(最初是第2项,有效地跳过节点)。

您需要做的是将元素保存在数组中然后更改它们,而不是在DOMNodeList上循环:

$this->_widgetList = array();
foreach ($domNodeList as $node) {
   $this->_widgetList[] = $node;    
}

foreach ($this->_widgetList as $widget) {
   // do stuff
}

答案 1 :(得分:0)

要避免两次迭代,可以解析反向元素列表

$widgets = $doc->getElementsByTagName( 'widget' ); // get all elements

for( $i = $widget->length; $i > 0; $i-- ){
    $widget = $doc->getElementsByTagName( 'widget' )->item( $i - 1 );

    // do stuff whith the widget
}