如何在没有PHP数据的情况下克隆不同的XML结构?

时间:2016-06-14 17:21:27

标签: php xml

我有一个XML文档,如下所示:

<root>

  <node/>

  <node>
    <sub>more</sub>
  </node>

  <node>
    <sub>another</sub>
  </node>

  <node>value</node>

</root>

这是我的伪代码:

import xml.

create empty-xml.

foreach child of imported-xml-root-node,

    recursively clone node structure without data.

    if clone does not match one already in empty-xml,
        then add clone to empty-xml.

我正试图得到一个看起来像这样的结果:

<root>

  <node/>

  <node>
    <sub/>
  </node>

</root>

注意我的piddly示例数据只有3个节点深。在生产中,将有未知数量的后代,因此可接受的答案需要处理变量节点深度。

方法失败

我已经审核了The DOMNode class,其中cloneNode方法带有我想要使用的递归选项,尽管清除数据需要一些额外的工作。但是当类包含一个返回布尔值的hasChildNodes函数时,我找不到实际返回子集合的方法。

$doc = new DOMDocument();
$doc->loadXML($xml);

$root_node = $doc->documentElement;

if ( $root_node->hasChildNodes() ) {

  // looking for something like this:
  // foreach ($root_node->children() as $child)
  //   $doppel = $child->cloneNode(true);

}

其次,我已尝试使用The SimpleXMLElement class,它有一个很棒的children方法。虽然它缺少递归选项,但我构建了一个简单的函数来克服它。但是这个类缺少一个clone / copyNode方法,而且我的函数正在膨胀成一些令人讨厌的补偿。现在我正在考虑结合这两个类的使用,这样我就可以访问SimpleXMLElement::childrenDOMDocument::cloneNode,但我可以说这不是干净利落,当然这个问题可以更好地解决。< / p>

$sxe = new SimpleXMLElement($xml);

$indentation = 0;

function getNamesRecursive( $xml, &$indentation )
{
    $indentation++;
    foreach($xml->children() as $child) {
        for($i=0;$i<$indentation;$i++)
          echo "\t";
        echo $child->getName() . "\n";
        getNamesRecursive($child,$indentation);
    }
    $indentation--;
}

getNamesRecursive($sxe,$indentation);

2 个答案:

答案 0 :(得分:1)

考虑XSLT,这是专门用于转换XML文件的专用语言。 PHP维护着一个XSLT 1.0处理器。您只需要保留位置1的项目并仅复制其元素而不是文本。

XSLT (另存为.xsl文件,以便在php中使用)

<xsl:transform xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:output version="1.0" encoding="UTF-8" indent="yes" omit-xml-declaration="yes" />
<xsl:strip-space elements="*"/>

  <!-- Identity Transform -->
  <xsl:template match="@*|node()">
    <xsl:copy>      
        <xsl:apply-templates select="@*|node()"/>      
    </xsl:copy>
  </xsl:template>

  <!-- Remove any nodes position greater than 2 -->
  <xsl:template match="*[position() &gt; 2]"/>   

  <!-- Copy only tags -->
  <xsl:template match="/*/*/*">
    <xsl:copy/>
  </xsl:template>

</xsl:transform>

PHP

// LOAD XML AND XSL FILES
$xml = new DOMDocument('1.0', 'UTF-8');
$xml->load('Input.xml');

$xslfile = new DOMDocument('1.0', 'UTF-8');
$xslfile->load('Script.xsl');

// TRANSFORM XML with XSLT
$proc = new XSLTProcessor;
$proc->importStyleSheet($xslfile); 
$newXml = $proc->transformToXML($xml);

// ECHO OUTPUT STRING
echo $newXml;
# <root>
#   <node/>
#   <node>
#     <sub/>
#   </node>
# </root>

// NEW DOM OBJECT
$final = new DOMDocument('1.0', 'UTF-8');
$final->loadXML($newXml);

答案 1 :(得分:0)

好吧,这是我的臭溶液。 suggestions for improvements或者全新的更好的答案仍然非常受欢迎。

$xml = '
<root>
  <node/>
  <node>
    <sub>more</sub>
  </node>
  <node>
    <sub>another</sub>
  </node>
  <node>value</node>
</root>
';
$doc = new DOMDocument();
$doc->loadXML($xml);


// clone without data
$empty_xml = new DOMDocument();
$empty_xml->appendChild($empty_xml->importNode($doc->documentElement));
function clone_without_data(&$orig, &$clone, &$clonedoc){
  foreach ($orig->childNodes as $child){
    if(get_class($child) === "DOMElement")
      $new_node = $clone->appendChild($clonedoc->importNode($child));
    if($child->hasChildNodes())
      clone_without_data($child,$new_node,$clonedoc);
  }
}
clone_without_data($doc->documentElement, $empty_xml->documentElement, $empty_xml);


// remove all duplicates
$distinct_structure = new DOMDocument();
$distinct_structure->appendChild($distinct_structure->importNode($doc->documentElement));
foreach ($empty_xml->documentElement->childNodes as $child){
  $match = false;
  foreach ($distinct_structure->documentElement->childNodes as $i => $element){
    if ($distinct_structure->saveXML($element) === $empty_xml->saveXML($child)) {
      $match = true;
      break;
    }
  }
  if (!$match)
    $distinct_structure->documentElement->appendChild($distinct_structure->importNode($child,true));
}
$distinct_structure->formatOutput = true;
echo $distinct_structure->saveXML();

这导致此输出:

<?xml version="1.0"?>
<root>
  <node/>
  <node>
    <sub/>
  </node>
</root>