PHP XPath搜索返回0结果

时间:2013-08-08 21:09:42

标签: php xml xpath

下面我有一个PHP脚本,我需要搜索XML文件并找到<AnotherChild>的ID。出于某种原因,目前它返回0结果,我无法弄清楚原因。如果有人能够理解为什么它会返回0结果我会非常感激,如果他们能让我知道原因。

XML:

<TransXChange xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns="http://www.transxchange.org.uk/" xsi:schemaLocation="http://www.transxchange.org.uk/ http://www.transxchange.org.uk/schema/2.1/TransXChange_general.xsd" CreationDateTime="2013-07-12T18:12:21.8122032+01:00" ModificationDateTime="2013-07-12T18:12:21.8122032+01:00" Modification="new" RevisionNumber="3" FileName="swe_44-611A-1-y10.xml" SchemaVersion="2.1">
    <Node1>...</Node1>
    <Node2>...</Node2>
    <Node3>...</Node3>
    <Node4>...</Node4>
    <Node5>...</Node5>
    <Node6>...</Node6>
    <Node7>
        <Child>
            <id>ABCDEFG123</id>
        </Child>
        <AnotherChild>
            <id>ABCDEFG124</id>
        </AnotherChild>
    </Node7>
    <Node8>...</Node8>
</TransXChange>

PHP:

<?php

  $xmldoc = new DOMDocument();
  $xmldoc->load("directory1/directory2/file.xml");

  $xpathvar = new DOMXPath($xmldoc);
  $xpathvar->registerNamespace('transXchange', 'http://www.transxchange.org.uk/');

  $queryResult = $xpathvar->query('//AnotherChild/id');
  foreach($queryResult as $result) {
    echo $result->textContent;
  }
?>

由于

2 个答案:

答案 0 :(得分:9)

评论中链接的两个问题确实回答了这个问题,但是他们并没有明确说明为什么他们回答了IMO,所以我将在my answer in chat之后添加以下内容


考虑以下XML文档:

<root>
  <child>
    <grandchild>foo</grandchild>
  </child>
</root>

这根本没有xmlns属性,这意味着您可以查询//grandchild并获得您期望的结果。每个节点都在默认命名空间中,因此无需在XPath中注册命名空间即可解决所有问题。

现在考虑一下:

<root xmlns="http://www.bar.com/">
  <child>
    <grandchild>foo</grandchild>
  </child>
</root>

这声明了http://www.bar.com/的命名空间,因此必须使用该命名空间来寻址成员节点。

正如您已经想到的那样,这样做的方法是使用DOMXPath::registerNamespace() - 但您错过的关键点是(在PHP的XPath实现中)每个命名空间必须使用前缀注册,您必须使用该前缀来处理属于它的节点。在XPath中使用空前缀注册名称空间是不可能的。

所以,鉴于上面的第二个例子,让我们看看我们将如何执行原始的//grandchild查询:

<?php

    $doc = new DOMDocument();
    $doc->loadXML($xml);

    $xpath = new DOMXPath($doc);
    $xpath->registerNamespace('bar', 'http://www.bar.com/');

    $nodes = $xpath->query('//bar:grandchild');
    foreach($nodes as $node) {
        // do stuff with $node
    }

注意我们如何使用它的URI注册命名空间,并指定了前缀。即使原始XML不包含此前缀,我们也会在查询中使用前缀 - example

要理解原因,让我们看看另一段XML:

<baz:root xmlns:baz="http://www.bar.com/">
  <baz:child>
    <baz:grandchild>foo</baz:grandchild>
  </baz:child>
</baz:root>

本文档在语义上与第二个相同 - 代码示例与(proof)同样适用。前缀与命名空间分开。请注意,即使在文档中使用baz:前缀,XPath也会使用bar:前缀。这是因为标识命名空间的思路是URI,不是前缀。

因此,当文档使用命名空间时,我们必须使用命名空间而不是反对它,通过在XPath中注册命名空间并使用我们注册的前缀来引用属于它的任何节点到那个命名空间。

为了完整起见,当我们将这些原则应用于您的原始文档时,您将与问题中的代码一起使用的查询是:

//transXchange:AnotherChild/transXchange:id

答案 1 :(得分:2)

要解决此问题,我首先注册了命名空间:

$xpathvar->registerNamespace('transXchange', 'http://www.transxchange.org.uk/');

然后像这样修改查询:

$queryResult = $xpathvar->query('//transXchange:AnotherChild/transXchange:id');

这成功返回了ID。