如何从维基百科页面获取pageid?

时间:2015-03-17 16:22:14

标签: python-2.7 flask wikipedia wikipedia-api pywikibot

在Flask应用程序中,或者甚至更好地使用维基百科API,如何从维基百科网址获取pageid?

我的意思是从http://en.wikipedia.org/wiki/Stack_Overflow到此http://en.wikipedia.org/wiki?curid=21721040

从API沙箱我可以解决它,但只能从标题中搜索,而不能从单个URL中搜索。

说搜索示例: https://en.wikipedia.org/wiki/Special:ApiSandbox#action=query&prop=pageprops&format=json&ppprop=wikibase_item&titles=Stack%20Overflow

我可以更直接的方式查询它而无需借助维基百科搜索吗?我的意思是我已经知道了人类可读的网址......

1 个答案:

答案 0 :(得分:6)

不,您不能在API中使用网址,您需要使用网页名称或网页ID来识别文章。

请注意,您找到的https://en.wikipedia.org/w/api.php?action=query&titles=Stack%20Overflow不是"搜索",它只是从标题中获取页面ID的查询。使用它。