我构建了一个应用程序,可以让您选择自己喜欢的科目,这些科目应该在DB中。
有数百万'喜欢'! (披萨,PHP,曼彻斯特联合,任何电影......我都不知道),所以我决定将这些“喜欢”插入我的数据库中,并附上维基百科。
嗯,有一种方法可以获得所有这些'喜欢'(api我有一个限制[我觉得每次搜索500次]?或另一种解决方案?
非常感谢。
答案 0 :(得分:1)
您实际上想要从维基百科中检索哪些信息有点不清楚。页面标题?
Wikimedia提供的XML文件包含download.wikimedia.org所有项目的所有页面标题。 (遗憾的是,由于硬件问题,转储似乎目前无法使用)。您可以解析XML文件并将所有标题存储在您自己的数据库中。
答案 1 :(得分:1)
查看WikiMedia技术文档。有一节讨论query continuation。
或者,您可以下载Wikipedia转储,安装自己的WikiMedia副本并查询您的内容。转储是巨大的,但取决于你想要提取多少东西,这可以更快地完成任务,并且对维基百科服务的影响较小。
答案 2 :(得分:0)
转储可以从维基百科以各种格式获得,具有不同的详细程度。
选择一个最适合您需求并解析它。