RSS XML解析问题(如何从RSS提要中获取媒体内容值?)

时间:2013-05-01 12:27:09

标签: php xml rss simplexml

我有一个rss feed url,它生成一个xml,如下所示:

 <?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/" 
 xmlns:flow="http://www.flownetworks.com/schemas/media/0.1.0"><channel>
 <title>flow-Media Catalog</title>
 <link>http://catalog.flownetworks.com/catalogs/1/videos.mrss</link>
 <description>Video Catalog</description>
 <image>
    <url>http://images.flow-media.com/flow_media_current.png</url>
    <title>Get to know flow-Media</title>
    <link>http://www.flow-media.com</link>
 </image>
 <generator>flow-Media</generator>
 <item>
   <title>..</title>
   <link>..</link>
   <description>..</description>
   <pubDate>Wed, 01 May 2013 07:01:08 GMT</pubDate>
   <guid isPermaLink="false">9809880</guid>
   <flow:short_description/>
   <flow:video_product_id>52985890</flow:video_product_id>
   <flow:availability end="" start="2013-05-01T06:44:41Z"/>
   <flow:show/>
   <media:group>
   <media:category>US</media:category>
   <media:thumbnail url="http://images.flow-media.com/ap/2013/05/01/09d462107646ab09def454a1a923a423edd6d2d9_preview.jpg" height="360" width="640"/>
   <media:thumbnail url="http://images.flow-media.com/ap/2013/05/01/09d462107646ab09def454a1a923a423edd6d2d9_thumbnail.jpg" height="90" width="160"/>
   <media:content duration="101" medium="video" isDefault="true" url="http://player.flownetworks.com/swf/cube.swf?a=V5299690&amp;m=9&amp;w=420&amp;h=375" type="application/x-shockwave-flash" expression="full" height="375" lang="en-us" width="420">
    </media:content>
    </media:group>
   </item>
   </channel>

我想在数据库中保存图像和类别值。这是我的PHP代码:

$apiURL="http://catalog.flownetworks.com/catalogs/01/videos/search.mrss?api_key=%206784cb3bed8f80c55054ac0de996f8e9f0bf8763";
$videoId="&video_product_id=".$videoID."";
$combinevURL=$apiURL.$videoId;
$mediafile = simplexml_load_file($combinevURL); 

问题:问题是“simplexml_load_file”不生成xml的类别名称和媒体缩略图图像值。我想从这个xml.Please帮助中获取值。

1 个答案:

答案 0 :(得分:2)

要成功获取这些媒体元素,首先需要找到父元素。如何访问这些非命名空间的元素在the basic Simplexml usage examples中有详细介绍,我在这里为您节省了这些高度冗余的代码。

因此,在将父项转换为变量之后 - 让我们这次调用它$item - 它的工作原理如the already hinted duplicated Q&A material中所述,这里仅针对您的示例XML:

$media = $item->children('media', true);
                            |
                          __|__
 <rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/" 
                    xmlns:flow="http://www.flownetworks.com/schemas/media/0.1.0">

通过使用namespace-prefix,它对应于突出显示的前缀部分。这需要使用true作为第二个参数。

你也可以使用替代方法,命名空间-URI,这样就可以省去第二个参数(默认为FALSE):

$media = $item->children('http://search.yahoo.com/mrss/');
                                        |
                                 _______|_____________________
 <rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/" 
                    xmlns:flow="http://www.flownetworks.com/schemas/media/0.1.0">

无论您喜欢哪种变体,在 media XML命名空间中准确地告诉simplexml您可以关注 children ,这样您就可以从该媒体组中访问各个部分如你所知:

$group = $media->group;
echo $group->category, "\n"; # US

我希望这有用,并明确地向您展示它如何对命名空间元素起作用。您需要使用SimpleXMLElement::children()方法并指定从中获取子元素的名称空间。