使用PHP解析XML CDATA

时间:2009-08-07 20:02:12

标签: php xml rss

我有一点问题,我无法弄清楚如何解决。 我有一个XML(实际上是它的RSS)文件,我试图用PHP解析,但CDATA标签出来了。

这是XML代码 这是PHP file

一切正常,但描述标签不打印。 如果有人能提供帮助,我将非常感激。

1 个答案:

答案 0 :(得分:17)

出于好奇,在获取XML 之后(我希望我在这个过程中没有破坏它 - 我会看看我是否可以编辑OP来纠正它)

  • 您是否将描述转换为字符串?


我的意思是你可以使用它:

$xml = simplexml_load_string($str);
foreach ($xml->channel->item as $item) {
    var_dump($item->description);
}

但它只会让你:

object(SimpleXMLElement)[5]
object(SimpleXMLElement)[3]

哪个不太好......


您需要将数据转换为字符串,如下所示:

$xml = simplexml_load_string($str);
foreach ($xml->channel->item as $item) {
    var_dump((string)$item->description);
}

你得到了描述:

string '

This is one of the content that I need printed on the screen, but nothing is happening. Please, please...output something... <br /><br /> <b>Showing</b>: 2 weeks<br /> <b>Starting On</b>: August 7, 2009 <br /> <b>Posted On</b>: August 7, 2009 <br />
<a href="http://www.mysite.com">click to view</a> 
            ' (length=329)

string '

Another content...This is another of the content that I need printed on the screen, but nothing is happening. Please, please...output something... <br /><br /> <b>Showing</b>: 2 weeks<br /> Starting On: August 7, 2009 <br /> <b>Posted On</b>: August 7, 2009
; 
               ' (length=303)

(对那些可能有用的trim,顺便说一下,如果你的XML是缩进的)


否则......好吧,我们可能需要你的PHP代码(至少,知道你如何获得description标签; - )


修改

感谢重新格式化的XML!

如果我转到pastebin,在页面底部的textarea中,在<?xml version="1.0" encoding="utf-8"?>

之前的XML开头有一个空白区域

如果你的真实XML数据中有那个,那么它将成为问题的根源:它是无效的XMl(XML声明必须是XML数据中的第一个事物)。 你会得到像这样的错误:

Warning: simplexml_load_string() [function.simplexml-load-string]: Entity: line 1: parser error : XML declaration allowed only at the start of the document
你能检查一下吗?
如果问题出现在这里,你应该激活error_reportingdisplay_errors ;-)这会有所帮助!


在看了PHP文件后编辑:

在for循环中,您这样做是为了获取您的描述数据:

$item_desc = $x->item($i)->getElementsByTagName('description')->item(0)->childNodes->item(0)->nodeValue;

描述不包含任何childNode,我会说;怎么样直接使用它的nodeValue?
像这样:

$item_desc = $x->item($i)->getElementsByTagName('description')->item(0)->nodeValue;

这种方式似乎更好: - )

作为旁注,我想你可能对其他标签做同样的事情;例如,这似乎也有效:

$item_title=$x->item($i)->getElementsByTagName('title')->item(0)->nodeValue;
$item_link=$x->item($i)->getElementsByTagName('link')->item(0)->nodeValue;

这给你带来了什么?


另一个编辑:这是我可能会使用的代码:

$xmlDoc = new DOMDocument();
$xmlDoc->loadXML($str);         // I changed that because I have the XML data in a string

//get elements from "<channel>"
$channel = $xmlDoc->getElementsByTagName('channel')->item(0);
$channel_title = $channel->getElementsByTagName('title')->item(0)->nodeValue;
$channel_link = $channel->getElementsByTagName('link')->item(0)->nodeValue;
$channel_desc = $channel->getElementsByTagName('description')->item(0)->nodeValue;

//output elements from "<channel>"
echo "<p><a href='" . $channel_link . "'>" . $channel_title . "</a>";
echo "<br />";
echo $channel_desc . "</p>";

//get and output "<item>" elements
$x = $xmlDoc->getElementsByTagName('item');
for ($i=0 ; $i<=1 ; $i++) {
    $item_title = $x->item($i)->getElementsByTagName('title')->item(0)->nodeValue;
    $item_link = $x->item($i)->getElementsByTagName('link')->item(0)->nodeValue;
    $item_desc = $x->item($i)->getElementsByTagName('description')->item(0)->nodeValue;
    echo ("<p><a href='" . $item_link
    . "'>" . $item_title . "</a>");
    echo ("<br />");
    echo ($item_desc . "</p>");
    echo' <p />';
}

注意我在字符串中包含XML数据,我不需要从URL中获取它,因此我使用的是loadXML方法,而不是load

主要的区别是我删除了一些childNodes访问,我认为没有必要。
这对你来说好吗?