从rss(xml)提要中删除CDATA标记

时间:2012-04-12 08:10:21

标签: rss xml-parsing cdata

我最好先说我不是程序员。我正在修改一个购物车,现在有一个问题超过了我的薪水。购物车允许我在页面上的块中显示rss feed的输出。问题是Feed的大部分内容都在CDATA标签内,因此无法正常显示。我需要从Feed中删除CDATA标记。<​​/ p>

处理Feed的代码是

    function fn_get_rss_feed($data)
    {
if (!empty($data['feed_url'])) {
    $data_key = 'rss_data_cache_' . (isset($data['block_data']['block_id']) ? $data['block_data']['block_id'] : 0);

    if (!empty($data['cache_time'])) {
        Registry::register_cache($data_key, $data['cache_time'], CACHE_LEVEL_TIME);
    }

    if (Registry::is_exist($data_key) == false) {
        $limit = !empty($data['max_item']) ? $data['max_item'] : 3;
        $rss_data = array();

        $rss = simplexml_load_string(fn_get_contents($data['feed_url']));

        if (!empty($rss)) {
            $it = 0;
            $items = array();
            foreach ($rss->channel->item as $item) {
                if ($it > $limit) {
                    break;
                }

                $items[] = array(
                    'title' => (string)$item->title,
        'description' => (string)$item->description,
                    'pubDate' => (string)$item->pubDate,
                    'link' => (string)$item->link
                );

                $it++;
            }

            $rss_data = array(array(
                $items,
                (string)$rss->channel->link,
                $data['feed_url']
            ));

            Registry::set($data_key, $rss_data);
        }

        return $rss_data;
    } else {
        return Registry::get($data_key);
    }
     }

        return array();
       }

这是“描述”,它周围有CDATA标签。在网上搜索我发现这段代码用于从字符串中删除CDATA标签。

     function strip_cdata($string)
    {    preg_match_all('/<!\[cdata\[(.*?)\]\]>/is', $string, $matches);
    return str_replace($matches[0], $matches[1], $string);
    }

我假设有一种方法可以使用该函数从描述周围剥离cdata标签 - 或者可能没有。 rss feed的输出通过.tpl文件显示。

任何和所有的帮助都感激地收到了。

布鲁斯

1 个答案:

答案 0 :(得分:0)

只需更改行

 $rss = simplexml_load_string(fn_get_contents($data['feed_url']));

 $rss = simplexml_load_string(fn_get_contents($data['feed_url']), 'SimpleXMLElement', LIBXML_NOCDATA);

应该有效。第三个参数指示simplexml函数使用的基础库将CDATA的内容合并到文本节点中(请参阅http://php.net/manual/en/function.simplexml-load-string.phphttp://www.php.net/manual/en/libxml.constants.php)。