如何为RSS Feed动态生成XML文件?

时间:2013-06-21 07:08:13

标签: python rss

我想创建一个RSS Feed生成器。生成器应该从我的数据库中读取数据并为它们生成RSS源。我想编写一个脚本,自动生成xml文件进行验证。

因此,如果RSS feed的典型xml文件如下所示:

  <item>
  <title>Entry Title</title>
  <link>Link to the entry</link>
  <guid>http://example.com/item/123</guid>
  <pubDate>Sat, 9 Jan 2010 16:23:41 GMT</pubDate>
  <description>[CDATA[ This is the description. ]]</description>
  </item>

我希望脚本自动替换<item></item>标记之间的字段。 同样适用于所有标签。标记的值将从数据库中获取。所以我会查询它。我的应用程序是在Django中设计的。

我正在寻找有关如何在python中执行此操作的建议。如果我的想法含糊不清,我也会接受任何其他选择。

3 个答案:

答案 0 :(得分:10)

因为这是python。使用PyRSS2Gen很好。它易于使用,非常好地生成xml。 https://pypi.python.org/pypi/PyRSS2Gen

答案 1 :(得分:3)

到目前为止你尝试了什么?

一个非常基本的方法是使用Python DB API查询数据库并使用str.format执行一些简单的格式化(我直接在SO中键入 - 所以要注意拼写错误):

>>> RSS_HEADER = """
<whatever><you><need>
"""
>>> RSS_FOOTER = """
</need></you></whatever>
"""

>>> RSS_ITEM_TEMPLATE = """
<item>
    <title>{0}</title>
    <link>{1}</link>
</item>
"""


>>> print RSS_HEADER

>>> for row in c.execute('SELECT title, link FROM MyThings ORDER BY TheDate'):
        print RSS_ITEM_TEMPLATE.format(*row)

>>> print RSS_FOOTER

答案 2 :(得分:1)

这个粗略的代码使用了一个名为BeautifulSoup的非常有用的库。它充当HTML / XML标记语言的解析器,提供python对象模型。它可用于从XML中提取/更改信息,或通过构建对象模型来创建XML。

下面的代码通过更改pastebin上的模板中的XML标记来实现。它通过复制模板“item”标签,清除其子标签并使用合适的字典条目填充它们来完成此操作,这些条目可能来自数据库。

# Import System libraries
from copy import copy
from copy import deepcopy

# Import Custom libraries
from BeautifulSoup import BeautifulSoup, BeautifulStoneSoup, Tag, NavigableString, CData

def gen_xml(record):

    description_blank_str = \
    '''
    <item>
    <title>Entry Title</title>
    <link>Link to the entry</link>
    <guid>http://example.com/item/123</guid>
    <pubDate>Sat, 9 Jan 2010 16:23:41 GMT</pubDate>
    <description>[CDATA[ This is the description. ]]</description>
    </item>
    '''
    description_xml_tag = BeautifulStoneSoup(description_blank_str)

    key_pair_locations = \
    [
        ("title", lambda x: x.name == u"title"),
        ("link", lambda x: x.name == u"link"),
        ("guid", lambda x: x.name == u"guid"),
        ("pubDate", lambda x: x.name == u"pubdate"),
        ("description", lambda x: x.name == u"description")
    ]

    tmp_description_tag_handle = deepcopy(description_xml_tag)

    for (key, location) in key_pair_locations:
        search_list = tmp_description_tag_handle.findAll(location)
        if(not search_list):
            continue
        tag_handle = search_list[0]
        tag_handle.clear()
        if(key == "description"):
            tag_handle.insert(0, CData(record[key]))
        else:
            tag_handle.insert(0, record[key])

    return tmp_description_tag_handle

test_dict = \
{
    "title" : "TEST",
    "link" : "TEST",
    "guid" : "TEST",
    "pubDate" : "TEST",
    "description" : "TEST"
}
print gen_xml(test_dict)