标签: node.js wikipedia-api
我使用维基百科API从某些页面获取信息框。 一个例子是Imperial College London 我的问题是我得到的HESA student population|INSTID=0132值。我希望得到学生人数,但我得到的是上面的id。如何获取页面中存在的信息框的值?
HESA student population|INSTID=0132
此外,如果您检查wiki page,则有两个信息框(主要和排名)。我怎样才能得到它们?
答案 0 :(得分:2)
您可以使用其他REST API来访问维基百科内容。要获得您要求的文章的结构良好的HTML:
https://en.wikipedia.org/api/rest_v1/page/html/Imperial_College_London
HTML由Parsoid服务生成,该服务在DOM Spec之后生成HTML / RDFa内容。收件箱将是带有“信息框”类的html table元素,因此您可以轻松找到页面上的所有收件箱。
table
收件箱通常由复杂的模板创建,因此您可以更轻松地解析表格HTML。