应用错误收集

时间：2010-12-09 09:31:12

标签： php mediawiki wikipedia

我构建了一个应用程序，可以让您选择自己喜欢的科目，这些科目应该在DB中。

有数百万'喜欢'！（披萨，PHP，曼彻斯特联合，任何电影......我都不知道），所以我决定将这些“喜欢”插入我的数据库中，并附上维基百科。

嗯，有一种方法可以获得所有这些'喜欢'（api我有一个限制[我觉得每次搜索500次]？或另一种解决方案？

非常感谢。

答案 0 :(得分：1)

您实际上想要从维基百科中检索哪些信息有点不清楚。页面标题？

Wikimedia提供的XML文件包含download.wikimedia.org所有项目的所有页面标题。（遗憾的是，由于硬件问题，转储似乎目前无法使用）。您可以解析XML文件并将所有标题存储在您自己的数据库中。

答案 1 :(得分：1)

查看WikiMedia技术文档。有一节讨论query continuation。

或者，您可以下载Wikipedia转储，安装自己的WikiMedia副本并查询您的内容。转储是巨大的，但取决于你想要提取多少东西，这可以更快地完成任务，并且对维基百科服务的影响较小。

答案 2 :(得分：0)

转储可以从维基百科以各种格式获得，具有不同的详细程度。

选择一个最适合您需求并解析它。