我想获取维基百科页面的内容,然后用它做一些有趣的事情。
我的想法是,我希望以XML / JSON格式获取它们,目前我似乎找不到办法。
目前我成功地走到了这一步:
我收到XWiki中的内容,由于页面不支持,我无法将其更改为JSON。
如何将XWiki解析为JSON或如何获取页面内容。
谢谢!
答案 0 :(得分:0)
是的,您可以使用XWiki Rendering中的HTML解析器来解析维基百科生成的HTML。这为你提供了一个AST,你可以随意做任何事情。
有关详细信息,请参阅http://rendering.xwiki.org/xwiki/bin/view/Main/WebHome。
您只需要找到一种以HTML格式获取维基百科内容的方法。