将模板和wikitext扩展为维基百科中的html(复制维基百科)

时间:2013-06-23 21:35:51

标签: wiki wikipedia-api mediawiki-api

您好我有一些自定义wikitext(也包括模板),需要转换为HTML。主要问题是我可以有任何维基百科模板,大多数解析器不进行模板扩展或需要手动下载模板。另一个复杂性是新的Lua模块(例如,Infobox模块使用#invoke),这打破了一些实现。以下是我尝试过的几件事:

  1. 尝试了gwtwiki(bliki)软件,但是不支持Lua模块,而且wikitext的html转换也有一些错误。(它似乎没有积极维护)

    1. 那么还有其他软件可以通过wiki api下载模板(也是Lua)并有效地解析wikitext。

    2. 我尝试使用revid获取模板以逃避Lua模块,但gwtwiki仍然失败。是否有其他库可以在本地下载模板和存储的wiki api。然后转换为html。

  2. 我找到了mediawiki的expandtemplates api调用,但是要转换的(wiki)文本是通过url get参数发送的,并且文本的大小存在固有的限制。是否有任何后期方法可以进行此转换。

  3. 我尝试的另一件事是获取整个维基百科的xml转储,并使用mediawiki软件复制pages / api / wiki。但是导入xml很痛苦。

    1. 是否有任何指南可以有效地执行此操作。
    2. 如果我做了一个简单的特殊操作,那么Lua插件就会失败:在我做了特别之后导入我的wiki:在维基百科中导出一篇文章。
    3. 在导入之后,我的sql转储中存在文章和模块,但它们似乎没有链接。 buildall.php脚本需要永远。

1 个答案:

答案 0 :(得分:0)

可以作为GET请求执行的所有MediaWiki API查询也可以使用POST。

我认为您想要的API模块是action=parse。类似的东西:

网址:http://en.wikipedia.org/w/api.php
POST数据:action = parse& text = your text