重组文本:提取书目和其他领域的最佳方法是什么?

时间:2013-04-03 22:30:32

标签: python restructuredtext

我正在组建一个网站,其中内容被维护为重组文本,然后转换为html。我需要更多控制,例如rst2html.py,所以我使用的是我自己的python脚本,它使用

之类的东西
docutils.core.publish_parts(source, writer_name='html')

创建html。

publish_parts()给了我有用的部分,如标题,正文等。但是,似乎我必须到别处去获取第一个字段的值,如

:Authors:
:version:

等。为此,我一直在使用

中的publish_doctree()
doctree = core.publish_doctree(source).asdom()

然后使用getElementsByTagName()递归地执行此操作,如

doctree.getElementsByTagName('authors')
doctree.getElementsByTagName('version')

使用publish_doctree()来提取字段可以完成工作,这很好,但它似乎比使用例如publish_parts()。 我的问题是,这是否是提取这些第一个字段的最佳推荐方法,还是有更直接,更少复杂的方式?如果没有,那很好,但我想如果我错过了什么我会询问。

0 个答案:

没有答案