Simple XML中的CData从XMLReader打开

时间:2012-04-07 18:53:37

标签: php simplexml xmlreader

我有一堆XML文件,我正在使用XMLReader加载到我的脚本中,创建DOM对象然后转换为Simplexml。

问题是其中一个XML文件使用了SIMPLEXML忽略的CDATA,并且通常使用SIMPLEXML_LOAD_FILE我会添加LIBXML_NOCDATA参数,但是当我使用simplexml_import_dom时,我无法弄清楚如何忽略下面的sceanrio中的CDATA。

有什么想法吗?

非常感谢 布雷特

$file = 'test.xml';
$reader = new XMLReader();
$reader->open($file);       
while ($reader->read())
{
    // are we in a product?
    if ($reader->nodeType == XMLReader::ELEMENT &&
        strtolower($reader->localName) == 'product')

    {
        if (!$node = $reader->expand()) {
            //do nothing 
        }
        else {
             // expand the node into a DOMNode
        // Convert to SimpleXML via DOM, messy but SimpleXML is soo much nicer.
        $dom  = new DomDocument();
        $dom->appendChild($dom->importNode($node, true));
        $products = simplexml_import_dom($dom);

        // do whatever we want to do with the product data

}

2 个答案:

答案 0 :(得分:4)

您可以尝试以下方式:

<?php
$str = $dom->saveXML();
$product = simplexml_load_string($str, 'SimpleXMLElement', LIBXML_NOCDATA | LIBXML_NOBLANKS);

答案 1 :(得分:1)

似乎有很多关于SimpleXML处理CDATA节点的混乱和错误信息。 不“忽略”CDATA ,它只是通过将其表示为对象而不是普通字符串来记住特定节点在CDATA中。

如果您始终遵循将SimpleXML的返回值显式转换为字符串的良好做法,您应该看到CDATA的内容就好了。

有关详情,请参阅http://php.net/function.simplexml-load-string.php#84365

或者,您提及的LIBXML_NOCDATA参数可以传递给simplexml_load_string。如果您出于某些其他原因确实需要XMLReader,则可能使用$reader->readOuterXML()而不是通过DOMDocument进行转换。