如何从rss获取自定义名称的元素?

时间:2012-04-07 13:46:14

标签: php xml rss

我有以下rss格式,我无法弹出'content:encoded'值。

<item>
    <title>some title</title>
    <link>some link</link>
    <pubDate>Sat, 07 Apr 2012 5:07:00 -0700</pubDate>
    <content:encoded><![CDATA[this value]]></content:encoded>
</item>

我写了这个函数,一切都运行良好,除了'content:encoded'字段给我这个错误:'注意:试图获取非对象的属性'

function rssReader($url) {
  $doc = new DOMDocument();
  $doc->load($url);
  $fields = array('title', 'description', 'link', 'pubDate', 'content:encoded');
  $nodes = array();

  foreach ($doc->getElementsByTagName('item') as $node) {
    $item = array();
    var_export($node, true);
    foreach ($fields as $field)
      $item[$field] = $node->getElementsByTagName($field)->item(0)->nodeValue;
    $nodes[] = $item;
  }

  return $nodes;
}

2 个答案:

答案 0 :(得分:2)

getElementsByTagName代码需要使用getElementsByTagNameNS代替'content:encoded'

foreach ($fields as $field){
  if( $field == 'content:encoded' ){
      $item[$field] = $node->getElementsByTagNameNS('contentNamespaceURI','encoded')->item(0)->nodeValue;
  }else{
      $item[$field] = $node->getElementsByTagName($field)->item(0)->nodeValue;
  }
}

您可以在'contentNamespaceURI'中找到rss。必须有类似的东西:

   xmlns:content="contentNamespaceURI"

答案 1 :(得分:1)

此处的标记名称为“已编码”。

只需使用

$content => $node->getElementsByTagName('encoded')->item(0)->nodeValue