我想创建一个RSS Feed生成器。生成器应该从我的数据库中读取数据并为它们生成RSS源。我想编写一个脚本,自动生成xml
文件进行验证。
因此,如果RSS feed的典型xml
文件如下所示:
<item>
<title>Entry Title</title>
<link>Link to the entry</link>
<guid>http://example.com/item/123</guid>
<pubDate>Sat, 9 Jan 2010 16:23:41 GMT</pubDate>
<description>[CDATA[ This is the description. ]]</description>
</item>
我希望脚本自动替换<item>
和</item>
标记之间的字段。
同样适用于所有标签。标记的值将从数据库中获取。所以我会查询它。我的应用程序是在Django中设计的。
我正在寻找有关如何在python中执行此操作的建议。如果我的想法含糊不清,我也会接受任何其他选择。
答案 0 :(得分:10)
因为这是python。使用PyRSS2Gen
很好。它易于使用,非常好地生成xml。 https://pypi.python.org/pypi/PyRSS2Gen
答案 1 :(得分:3)
到目前为止你尝试了什么?
一个非常基本的方法是使用Python DB API查询数据库并使用str.format
执行一些简单的格式化(我直接在SO中键入 - 所以要注意拼写错误):
>>> RSS_HEADER = """
<whatever><you><need>
"""
>>> RSS_FOOTER = """
</need></you></whatever>
"""
>>> RSS_ITEM_TEMPLATE = """
<item>
<title>{0}</title>
<link>{1}</link>
</item>
"""
>>> print RSS_HEADER
>>> for row in c.execute('SELECT title, link FROM MyThings ORDER BY TheDate'):
print RSS_ITEM_TEMPLATE.format(*row)
>>> print RSS_FOOTER
答案 2 :(得分:1)
这个粗略的代码使用了一个名为BeautifulSoup的非常有用的库。它充当HTML / XML标记语言的解析器,提供python对象模型。它可用于从XML中提取/更改信息,或通过构建对象模型来创建XML。
下面的代码通过更改pastebin上的模板中的XML标记来实现。它通过复制模板“item”标签,清除其子标签并使用合适的字典条目填充它们来完成此操作,这些条目可能来自数据库。
# Import System libraries
from copy import copy
from copy import deepcopy
# Import Custom libraries
from BeautifulSoup import BeautifulSoup, BeautifulStoneSoup, Tag, NavigableString, CData
def gen_xml(record):
description_blank_str = \
'''
<item>
<title>Entry Title</title>
<link>Link to the entry</link>
<guid>http://example.com/item/123</guid>
<pubDate>Sat, 9 Jan 2010 16:23:41 GMT</pubDate>
<description>[CDATA[ This is the description. ]]</description>
</item>
'''
description_xml_tag = BeautifulStoneSoup(description_blank_str)
key_pair_locations = \
[
("title", lambda x: x.name == u"title"),
("link", lambda x: x.name == u"link"),
("guid", lambda x: x.name == u"guid"),
("pubDate", lambda x: x.name == u"pubdate"),
("description", lambda x: x.name == u"description")
]
tmp_description_tag_handle = deepcopy(description_xml_tag)
for (key, location) in key_pair_locations:
search_list = tmp_description_tag_handle.findAll(location)
if(not search_list):
continue
tag_handle = search_list[0]
tag_handle.clear()
if(key == "description"):
tag_handle.insert(0, CData(record[key]))
else:
tag_handle.insert(0, record[key])
return tmp_description_tag_handle
test_dict = \
{
"title" : "TEST",
"link" : "TEST",
"guid" : "TEST",
"pubDate" : "TEST",
"description" : "TEST"
}
print gen_xml(test_dict)