使用PHP从Wikipedia JSON或XML中提取数据

时间:2010-05-29 21:25:16

标签: php xpath curl wikipedia

我想使用PHP(可能使用Curl / XPath?)从维基百科页面中提取数据。最好的方法是什么?我将在这个项目中使用CakePHP,虽然只需要弄清楚如何让它首先工作。

4 个答案:

答案 0 :(得分:1)

你可以使用这个使用CURL的PHP​​函数获取一些数据:

  

http://www.barattalo.it/2010/08/29/php-bot-to-get-wikipedia-definitions/

答案 1 :(得分:0)

以前曾经问过这个问题,请参阅Is there a Wikipedia API?,其中列出了与维基百科互动的几个选项。

答案 2 :(得分:0)

您可以下载维基百科数据库的快照并将其处理到自己的磁盘空间。这可以通过替代方案做出更好的解决方案。

维基百科数据库快照,您可以在以下网址找到:http://dumps.wikimedia.org/

答案 3 :(得分:0)

有几个选项:(在Google上搜索他们)
1. DBPedia
2. Freebase Wikipedia Extracs(WEX)
3.还有维基百科链接数据集