维基百科内容解析JSON

时间:2016-04-01 14:39:46

标签: java json parsing xwiki

我想获取维基百科页面的内容,然后用它做一些有趣的事情。

我的想法是,我希望以XML / JSON格式获取它们,目前我似乎找不到办法。

目前我成功地走到了这一步:

https://en.wikipedia.org/w/api.php?action=query&format=jsonfm&prop=revisions&titles=April_1&rvprop=content&rvcontentformat=text%2Fx-wiki

我收到XWiki中的内容,由于页面不支持,我无法将其更改为JSON。

如何将XWiki解析为JSON或如何获取页面内容。

谢谢!

1 个答案:

答案 0 :(得分:0)

是的,您可以使用XWiki Rendering中的HTML解析器来解析维基百科生成的HTML。这为你提供了一个AST,你可以随意做任何事情。

有关详细信息,请参阅http://rendering.xwiki.org/xwiki/bin/view/Main/WebHome

您只需要找到一种以HTML格式获取维基百科内容的方法。