如何将mwlib的simpleparse实例转换为html?

时间:2014-12-21 06:57:03

标签: python parsing python-2.7 mediawiki

我安装了python库mwlib,用于将任何wikimarkup文本转换为树。如:

from pprint ipoirt pprint
from mwlib.uparser import simpleparser

foo = """
* Some
* List

== A heading ==
Blah
"""

pprint(simpleparse(foo))

输出:

Article
    Paragraph tagname='p'->'p'
        u'\n'
        ItemList tagname='ul'->'ul'
            Item tagname='li'->'li'
                Node lineprefix=
                    u' Some'
                    u'\n'
            Item tagname='li'->'li'
                Node lineprefix=
                    u' List'
                    u'\n'
    Section tagname='@section' level=2
        Node
            u'A heading '
        Node
            u'\n'
            u'Blah'
            u'\n'

但奇怪的是,我找不到一种方法可以为我提供将其转换为HTML的方法吗?

我该怎么办?顺便说一句,如果你有一个将wiki标记转换为html的替代想法,那么欢迎,我不打算使用templatingreferencing进行排序。

1 个答案:

答案 0 :(得分:0)

要将wikitext转换为HTML,您需要一个解析器。如果您不能使用MediaWiki安装(使用标记中使用的相应解析器扩展),您可以尝试使用众多替代解析器中的一个(无法保证其中任何一个)。

https://www.mediawiki.org/wiki/Alternative_parsers