如何从一些维基百科页面获取内容部分数据?

时间:2016-09-26 18:29:41

标签: wikipedia wikidata

我正在寻找dump file(理想情况下)或API调用以获取维基百科页面的内容部分。例如Fitbit page

Fitbit content

任何帮助真的很感激。谢谢!

1 个答案:

答案 0 :(得分:1)

您可以通过解析页面使用MediaWiki API来完成此操作。对于您的示例,查询将是:

https://en.wikipedia.org/w/api.php?action=parse&prop=sections&page=Fitbit

回复将包含所有页面部分及其名称( s)和标题级别

{
    "parse": {
        "sections": [
            {
                "index": "1",
                "line": "Products",
                "level": "2",
                ...
            },
            {
                "index": "2",
                "line": "Fitbit Tracker",
                "level": "3",
                ...
            },
            {
                "index": "3",
                "line": "Fitbit Ultra",
                "level": "3",
                ...
            },
            ...
        ]
    }
}