如何将Wikipedia XML转换为HTML或PDF格式?

时间:2013-09-09 12:13:53

标签: java html pdf wikipedia

我有一个XML文件,可以从维基百科数据库下载,它包含维基百科的文章。 使用Java,我想将它们转换为PDF或Html格式,我该怎么做?

EDIT !!!!! : 我想使用mediawiki。

2 个答案:

答案 0 :(得分:0)

您需要精简XSL Tranformation,才能将XML转换为HTML。

答案 1 :(得分:0)

我使用wikimodel,它可以做我想要的,如果有人想做这样的工作我推荐wikimodel,就像下面的代码一样:

public String getHTMLFormat() {
    WikiModel wikiModel = new WikiModel(
            "http://en.wikipedia.org/wiki/${image}", "http://en.wikipedia.org/wiki/${title}");
    String htmlText = wikiModel.render(text);
    return htmlText;
}