首先,我是一个php新手。我查看了问题和解决方案 here 。然而,对于我的需求,解析并没有深入到各种文章中。
我的RSS Feed的一小部分内容如下:
<channel>
<atom:link href="http://mywebsite.com/rss" rel="self" type="application/rss+xml" />
<title>My Web Site</title>
<description>My Feed</description>
<link>http://mywebsite.com/</link>
<image>
<url>http://mywebsite.com/views/images/banner.jpg</url>
<title>My Title</title>
<link>http://mywebsite.com/</link>
<description>Visit My Site</description>
</image>
<item>
<title>Article One</title>
<guid isPermaLink="true">http://mywebsite.com/details/e8c5106</guid>
<link>http://mywebsite.com/geturl/e8c5106</link>
<comments>http://mywebsite.com/details/e8c5106#comments</comments>
<pubDate>Wed, 09 Jan 2013 02:59:45 -0500</pubDate>
<category>Category 1</category>
<description>
<![CDATA[<div>
<img src="http://mywebsite.com/myimages/1521197-main.jpg" width="120" border="0" />
<ul><li>Poster: someone's name;</li>
<li>PostDate: Tue, 08 Jan 2013 21:49:35 -0500</li>
<li>Rating: 5</li>
<li>Summary:Lorem ipsum dolor </li></ul></div><div style="clear:both;">]]>
</description>
</item>
<item>..
我要解析的图片链接是每个商品&gt;内部的图片链接。 说明
我的php文件中的代码为:
<?php
$xml = simplexml_load_file('http://mywebsite.com/rss?t=2040&dl=1&i=1&r=ceddfb43483437b1ed08ab8a72cbc3d5');
$imgs = $xml->xpath('/item/description/img');
foreach($imgs as $image) {
echo $image->src;
}
?>
有人可以帮我弄清楚如何配置上面的PHP代码?
这也是一个非常新手的问题......一旦我得到了生成的图片网址,我怎样才能在我的HTML上连续显示图片?
非常感谢!!!
Hernando的
答案 0 :(得分:2)
RSS源中的<img>
标签实际上不是XML文档的元素,与此站点上的语法高亮相反 - 它们只是<description>
元素中恰好包含字符的文本<
和>
。
字符串<![CDATA[
告诉XML解析器,从那里到遇到]]>
的所有内容都被视为原始字符串,无论它包含什么。这对于在HTML中嵌入HTML非常有用,因为HTML标记不一定是有效的XML。它等同于转义整个HTML(例如,使用htmlspecialchars
),以便<img>
标记看起来像<img>
。 (我进入了more technical details on another answer。)
因此,从RSS中提取图像需要两个步骤:首先,获取每个<description>
的文本,然后找到该文本中的所有<img>
标记。
$xml = simplexml_load_file('http://mywebsite.com/rss?t=2040&dl=1&i=1&r=ceddfb43483437b1ed08ab8a72cbc3d5');
$descriptions = $xml->xpath('//item/description');
foreach ( $descriptions as $description_node ) {
// The description may not be valid XML, so use a more forgiving HTML parser mode
$description_dom = new DOMDocument();
$description_dom->loadHTML( (string)$description_node );
// Switch back to SimpleXML for readability
$description_sxml = simplexml_import_dom( $description_dom );
// Find all images, and extract their 'src' param
$imgs = $description_sxml->xpath('//img');
foreach($imgs as $image) {
echo (string)$image['src'];
}
}
答案 1 :(得分:0)
我对xPath没有多少经验,但您可以尝试以下方法:
$imgs = $xml->xpath('item//img');
这将选择img
- 元素内的所有item
- 元素,无论其间是否有其他元素。删除前导斜杠将在文档中的任何位置搜索item
,而不仅仅是从根目录中搜索/rss/channel/item...
。否则,您需要<img>
。
至于显示图像:只输出foreach($imgs as $image) {
echo '<img src="' . $image->src . '" /><br />';
}
- 标记后跟换行符,如下所示:
<br>
首选的方法是使用CSS而不是{{1}} - 标签,但我认为它们起初更简单。