我正在组建一个网站,其中内容被维护为重组文本,然后转换为html。我需要更多控制,例如rst2html.py,所以我使用的是我自己的python脚本,它使用
之类的东西docutils.core.publish_parts(source, writer_name='html')
创建html。
publish_parts()给了我有用的部分,如标题,正文等。但是,似乎我必须到别处去获取第一个字段的值,如
:Authors:
:version:
等。为此,我一直在使用
中的publish_doctree()doctree = core.publish_doctree(source).asdom()
然后使用getElementsByTagName()递归地执行此操作,如
doctree.getElementsByTagName('authors')
doctree.getElementsByTagName('version')
等
使用publish_doctree()来提取字段可以完成工作,这很好,但它似乎比使用例如publish_parts()。 我的问题是,这是否是提取这些第一个字段的最佳推荐方法,还是有更直接,更少复杂的方式?如果没有,那很好,但我想如果我错过了什么我会询问。