我想使用PHP(可能使用Curl / XPath?)从维基百科页面中提取数据。最好的方法是什么?我将在这个项目中使用CakePHP,虽然只需要弄清楚如何让它首先工作。
答案 0 :(得分:1)
你可以使用这个使用CURL的PHP函数获取一些数据:
http://www.barattalo.it/2010/08/29/php-bot-to-get-wikipedia-definitions/
答案 1 :(得分:0)
以前曾经问过这个问题,请参阅Is there a Wikipedia API?,其中列出了与维基百科互动的几个选项。
答案 2 :(得分:0)
您可以下载维基百科数据库的快照并将其处理到自己的磁盘空间。这可以通过替代方案做出更好的解决方案。
维基百科数据库快照,您可以在以下网址找到:http://dumps.wikimedia.org/
答案 3 :(得分:0)
有几个选项:(在Google上搜索他们)
1. DBPedia
2. Freebase Wikipedia Extracs(WEX)
3.还有维基百科链接数据集