解析XML文档递归

时间:2017-05-16 08:29:42

标签: php xml recursion xml-parsing domdocument

我有包含文章信息的XML文档,这些文档具有一种层次结构:

<?xml version="1.0" encoding="UTF-8"?>

<page>
<elements>

<element>
<type>article</type>
<id>1</id>
<parentContainerID>page</parentContainerID>
<parentContainerType>page</parentContainerType>
</element>

<element>
<type>article</type>
<id>2</id>
<parentContainerID>1</parentContainerID>
<parentContainerType>article</parentContainerType>
</element>

<element>
<type>photo</type>
<id>3</id>
<parentContainerID>2</parentContainerID>
<parentContainerType>article</parentContainerType>
</element>

<... more elements ..>

</elements>
</page>

元素具有节点parentContainerID和节点parentContainerType。如果parentContainerType == page,则这是主元素。 parentContainerID显示元素的主要内容。所以看起来应该是:1 < - 2 < - 3

现在我需要构建一个这样的东西的新页面(html): ID 1的内容,ID 2的内容,ID 3的内容(ID不在进行中)。

我想这可以用递归函数完成。但我不知道如何管理这个?

1 个答案:

答案 0 :(得分:1)

这里没有XML中的嵌套/递归。 <element/>个节点是兄弟姐妹。为了构建父子关系,我建议循环遍历XML并构建两个数组。一个用于关系,一个用于引用元素。

$xml = file_get_contents('php://stdin');

$document = new DOMDocument();
$document->loadXml($xml);
$xpath = new DOMXpath($document);

$relations = [];
$elements = [];
foreach ($xpath->evaluate('//element') as $element) {
  $id = (int)$xpath->evaluate('string(id)', $element);
  $parentId = (int)$xpath->evaluate('string(parentContainerID)', $element);
  $relations[$parentId][] = $id;
  $elements[$id] = $element;
}

var_dump($relations);

输出:

array(3) {
  [0]=>
  array(1) {
    [0]=>
    int(1)
  }
  [1]=>
  array(1) {
    [0]=>
    int(2)
  }
  [2]=>
  array(1) {
    [0]=>
    int(3)
  }
}

关系数组现在包含任何父级的子ID,没有父级的元素位于索引0中。这允许您使用递归函数将元素作为树访问。

function traverse(
  int $parentId, callable $callback, array $elements, array $relations, $level = -1
) {
  if ($elements[$parentId]) {
     $callback($elements[$parentId], $parentId, $level);
  }
  if (isset($relations[$parentId]) && is_array($relations[$parentId])) {
    foreach ($relations[$parentId] as $childId) {
      traverse($childId, $callback, $elements, $relations, ++$level);
    }
  }
}

这将为每个节点执行回调。对此的正确实现将是RecursiveIterator,但该函数应该用于示例。

traverse(
  0,
  function(DOMNode $element, int $id, int $level) use ($xpath) {
    echo str_repeat(' ', $level);
    echo $id, ": ", $xpath->evaluate('string(type)', $element), "\n";
  },
  $elements,
  $relations
);

输出:

1: article
 2: article
  3: photo

请注意,$xpath对象是作为回调的上下文提供的。由于$elements数组包含原始节点,因此您可以使用Xpath表达式从DOM获取与当前元素节点相关的详细数据。