来自维基百科的页面列表

时间:2010-12-09 09:31:12

标签: php mediawiki wikipedia

我构建了一个应用程序,可以让您选择自己喜欢的科目,这些科目应该在DB中。

有数百万'喜欢'! (披萨,PHP,曼彻斯特联合,任何电影......我都不知道),所以我决定将这些“喜欢”插入我的数据库中,并附上维基百科。

嗯,有一种方法可以获得所有这些'喜欢'(api我有一个限制[我觉得每次搜索500次]?或另一种解决方案?

非常感谢。

3 个答案:

答案 0 :(得分:1)

您实际上想要从维基百科中检索哪些信息有点不清楚。页面标题?

Wikimedia提供的XML文件包含download.wikimedia.org所有项目的所有页面标题。 (遗憾的是,由于硬件问题,转储似乎目前无法使用)。您可以解析XML文件并将所有标题存储在您自己的数据库中。

答案 1 :(得分:1)

查看WikiMedia技术文档。有一节讨论query continuation

或者,您可以下载Wikipedia转储,安装自己的WikiMedia副本并查询您的内容。转储是巨大的,但取决于你想要提取多少东西,这可以更快地完成任务,并且对维基百科服务的影响较小。

答案 2 :(得分:0)

转储可以从维基百科以各种格式获得,具有不同的详细程度。

选择一个最适合您需求并解析它。