现在我正在使用mediawiki api和requests模块尝试从维基百科页面的某种表中提取某些信息。作为一个例子,我们将使用歌曲Zombie,其中有一个'表'在右边,它告诉我专辑,作者,发布日期等等。我遇到的唯一问题是我不知道如何查询此数据,因为我使用此链接作为端点:https://en.wikipedia.org/w/api.php?format=json&formatversion=2&action=query&titles=Zombie_(song)&prop=extracts 尝试搜索我需要的内容,但它会在页面上显示文本。我已经尝试过沙盒了,但是我试图找到能给我所需信息的东西。感谢任何建议和意见,谢谢。
答案 0 :(得分:0)
对于那种元数据,您最好使用维基数据。在维基百科的侧边栏中,有一个指向维基数据项的链接,您可以使用https://www.wikidata.org/w/api.php?action=wbgetclaims&entity=Q169298等API查询以结构化方式获取数据。有关这些结果的含义的信息,请参阅Wikibase API docs。
[编辑:]要获取实体ID,您可以将wbgetentities
与维基百科标题(titles
)和维基ID(sites
)一起使用;例如:https://www.wikidata.org/w/api.php?action=wbgetentities&sites=enwiki&titles=Zombie_(song)