使用PHP和xpath获取祖先节点

时间:2011-09-05 16:34:43

标签: php xml xpath simplexml

请原谅如果以下内容有点混乱,我一直在努力解决这个问题。

这是我用来为mini-CMS创建类别树的一大块XML(从一个大型站点导出)。一旦我得到了节点的值和名称,这没有问题,我还需要获得每个节点的“父”,即层次结构中位于它之上的节点。

    <productCategory>
    <genericName>DigitalCinema</genericName>
    <productCategories>
      <productCategory>
        <genericName>DCinemaProj</genericName>
        <productModels>
          <productModel>ProjProd-1</productModel>
          <productModel>ProjProd-2</productModel>
          <productModel>ProjProd-3</productModel>
          <productModel>ProjProd-4</productModel>
        </productModels>
      </productCategory>
      <productCategory>
        <genericName>DCinemaLens</genericName>
      </productCategory>
    </productCategories>
  </productCategory>

例如,对于productCategory-genericName DCinemaLens ,我需要能够将父级抓取为 DigitalCinema ,对于单个 productModel 节点,其中父节点为 DCinemaProj

我在xpath中使用祖先,前兄弟和父亲尝试了各种不同的查询,我仍然看不到抓住我需要的节点。

这是我的代码,因为它几分钟前放弃了我的尝试。

if ($xml->xpath('//productCategories')) {

    foreach($xml->xpath('//genericName | //productModel') as $genericName){

    echo "<p align='center'>$genericName";

    $type = $genericName->getName();

    echo " - (" . $type . ") ";

    $derp = $xml->xpath("ancestor::productCategory[1]/genericName");

    echo $derp;

    echo '</p>';

    }

    }

我在数组中获取信息也取得了一些成功,但它总是只返回XML中的每个值。

$key = 'genericName';

    $derpgleep = $derp[$key];

    echo 'Derp= ' . $derpgleep;

    print_r($derp);

希望我能忽略一个非常简单的解决方案。我希望我已经清楚了。

2 个答案:

答案 0 :(得分:2)

您正在使用的XPath表达式:

 ancestor::productCategory[1]/genericName
如果能够从当前节点开始执行该表达式,

将起作用。从当前的数组 $genericName开始,这是不可能的,因为它不包含父项,也不包含祖先。

我认为您的选择是重新遍历所有XML树。这是一个样本测试,根据您的输入样本,根据需要运行。

<?php
$xml = simplexml_load_file("test_input1.xml");

if ($xml->xpath('//productCategories')) {

    foreach($xml->xpath('//genericName') as $genericName){

        echo "<p align='center'>$genericName";

        $type = $genericName->getName();

        echo " - (" . $type . ") ";

        $derp = $xml->xpath("//genericName[.='" . 
            $genericName[0] . 
            "']/ancestor::productCategory[2]/genericName");

        echo $derp[0];  echo "</p>\n";
    }
}
?>

这将打印出以下HTML片段:

<p align='center'>DigitalCinema - (genericName) </p>
<p align='center'>DCinemaProj - (genericName) DigitalCinema</p>
<p align='center'>DCinemaLens - (genericName) DigitalCinema</p>

要获得 productModel 的“父级”,您需要一个xpath,如:

        $derp = $xml->xpath("//productModel[.='" . 
            $productModel[0] . 
            "']/parent::productCategory[1]/genericName");

答案 1 :(得分:1)

使用(假设初始上下文节点是productCategory[genericName = 'DCinemaLens']productModel):

../preceding-sibling::*[1]

基于XSLT的验证

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
  <xsl:copy-of select=
  "/*/*/productCategory
            [genericName = 'DCinemaLens']
               /../preceding-sibling::*[1]"/>
-------------
<xsl:text/>
  <xsl:copy-of select=
  "/*/*/*/*/productModel/../preceding-sibling::*[1]"/>
 </xsl:template>
</xsl:stylesheet>

将此转换应用于提供的XML文档

<productCategory>
    <genericName>DigitalCinema</genericName>
    <productCategories>
        <productCategory>
            <genericName>DCinemaProj</genericName>
            <productModels>
                <productModel>ProjProd-1</productModel>
                <productModel>ProjProd-2</productModel>
                <productModel>ProjProd-3</productModel>
                <productModel>ProjProd-4</productModel>
            </productModels>
        </productCategory>
        <productCategory>
            <genericName>DCinemaLens</genericName>
        </productCategory>
    </productCategories>
</productCategory>

将所需的两个元素复制到输出

<genericName>DigitalCinema</genericName>
-------------
<genericName>DCinemaProj</genericName>