维基百科API信息框

时间:2016-04-06 20:10:18

标签: node.js wikipedia-api

我使用维基百科API从某些页面获取信息框。 一个例子是Imperial College London 我的问题是我得到的HESA student population|INSTID=0132值。我希望得到学生人数,但我得到的是上面的id。如何获取页面中存在的信息框的值?

此外,如果您检查wiki page,则有两个信息框(主要和排名)。我怎样才能得到它们?

1 个答案:

答案 0 :(得分:2)

您可以使用其他REST API来访问维基百科内容。要获得您要求的文章的结构良好的HTML:

https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London

HTML由Parsoid服务生成,该服务在DOM Spec之后生成HTML / RDFa内容。收件箱将是带有“信息框”类的html table元素,因此您可以轻松找到页面上的所有收件箱。

收件箱通常由复杂的模板创建,因此您可以更轻松地解析表格HTML。