您好我有一些自定义wikitext(也包括模板),需要转换为HTML。主要问题是我可以有任何维基百科模板,大多数解析器不进行模板扩展或需要手动下载模板。另一个复杂性是新的Lua模块(例如,Infobox模块使用#invoke),这打破了一些实现。以下是我尝试过的几件事:
尝试了gwtwiki(bliki)软件,但是不支持Lua模块,而且wikitext的html转换也有一些错误。(它似乎没有积极维护)
那么还有其他软件可以通过wiki api下载模板(也是Lua)并有效地解析wikitext。
我尝试使用revid获取模板以逃避Lua模块,但gwtwiki仍然失败。是否有其他库可以在本地下载模板和存储的wiki api。然后转换为html。
我找到了mediawiki的expandtemplates api调用,但是要转换的(wiki)文本是通过url get参数发送的,并且文本的大小存在固有的限制。是否有任何后期方法可以进行此转换。
我尝试的另一件事是获取整个维基百科的xml转储,并使用mediawiki软件复制pages / api / wiki。但是导入xml很痛苦。
答案 0 :(得分:0)
可以作为GET请求执行的所有MediaWiki API查询也可以使用POST。
我认为您想要的API模块是action=parse
。类似的东西:
网址:http://en.wikipedia.org/w/api.php
POST数据:action = parse& text = your text