如何使用xsltproc从XML Feed中提取播客网址?

时间:2018-02-16 10:39:20

标签: xslt rss

我想用xsltproc(或我可以在Bash中使用的任何其他工具)从播客源中提取网址。有以下两种类型的XML提要。

输入A

<rss xmlns:media="http://search.yahoo.com/mrss/">
    <channel>
    <title>Podcast</title>
    <item>
        <title>Episode</title>
        <media:content url="http://example.org/example.mp3" fileSize="1234" type="audio/mpeg"/>
    </item>
    </channel>
</rss>

B类

<rss>
    <channel>
    <title>Podcast</title>
    <item>
        <title>Episode</title>
        <guid>episode::x</guid>
        <enclosure type="image/jpeg" url="http://example.org/coverart.jpg"/>
        <enclosure type="audio/mpeg" url="http://example.net/audio.mp3"/>
    </item>
    </channel>
</rss>

我有以下样式表,它返回类型B中的URL,但不是A类中的URL。我可以将这两个样本表混合在一起吗?

<?xml version="1.0"?>
<stylesheet version="1.0" xmlns="http://www.w3.org/1999/XSL/Transform">
    <output method="text"/>
    <template match="/">
        <for-each select = "rss/channel/item/enclosure">
            <value-of select="@url"/><text>&#10;</text>
        </for-each>
        <for-each select = "rss/channel/item/media">
            <value-of select="@url"/><text>&#10;</text>
        </for-each>
    </template>
</stylesheet>

1 个答案:

答案 0 :(得分:1)

Type A XML中,有一个与<content>节点关联的命名空间,其别名为media。命名空间不包含在样式表中。它需要包含在样式表中,以便正确访问与命名空间关联的元素。

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" 
    xmlns:media="http://search.yahoo.com/mrss/"
    exclude-result-prefixes="media">

在模板内部,for-each循环应为media:content,(content元素缺失。)

<xsl:for-each select="//media:content">
    <xsl:value-of select="@url" />
    <xsl:text>&#10;</xsl:text>
</xsl:for-each>