我有一堆XML文件,我正在使用XMLReader加载到我的脚本中,创建DOM对象然后转换为Simplexml。
问题是其中一个XML文件使用了SIMPLEXML忽略的CDATA,并且通常使用SIMPLEXML_LOAD_FILE我会添加LIBXML_NOCDATA参数,但是当我使用simplexml_import_dom时,我无法弄清楚如何忽略下面的sceanrio中的CDATA。
有什么想法吗?
非常感谢 布雷特
$file = 'test.xml';
$reader = new XMLReader();
$reader->open($file);
while ($reader->read())
{
// are we in a product?
if ($reader->nodeType == XMLReader::ELEMENT &&
strtolower($reader->localName) == 'product')
{
if (!$node = $reader->expand()) {
//do nothing
}
else {
// expand the node into a DOMNode
// Convert to SimpleXML via DOM, messy but SimpleXML is soo much nicer.
$dom = new DomDocument();
$dom->appendChild($dom->importNode($node, true));
$products = simplexml_import_dom($dom);
// do whatever we want to do with the product data
}
答案 0 :(得分:4)
您可以尝试以下方式:
<?php
$str = $dom->saveXML();
$product = simplexml_load_string($str, 'SimpleXMLElement', LIBXML_NOCDATA | LIBXML_NOBLANKS);
答案 1 :(得分:1)
似乎有很多关于SimpleXML处理CDATA节点的混乱和错误信息。 不“忽略”CDATA ,它只是通过将其表示为对象而不是普通字符串来记住特定节点在CDATA中。
如果您始终遵循将SimpleXML的返回值显式转换为字符串的良好做法,您应该看到CDATA的内容就好了。
有关详情,请参阅http://php.net/function.simplexml-load-string.php#84365
或者,您提及的LIBXML_NOCDATA
参数可以传递给simplexml_load_string
。如果您出于某些其他原因确实需要XMLReader,则可能使用$reader->readOuterXML()
而不是通过DOMDocument
进行转换。