使用PHP,如何使用MediaWiki API获取维基百科文章的第一段?

时间:2012-02-21 16:28:36

标签: php curl wikipedia wikipedia-api mediawiki-api

如何使用PHP通过MediaWiki API从维基百科获取任何文章的第一段?

我对所有建议持开放态度。最有可能CURLXML派上用场。

2 个答案:

答案 0 :(得分:2)

您可以这样使用API​​:

http://en.wikipedia.org/w/api.php?action=parse&page=Stack_overflow&format=xml&prop=text&section=0

这将返回一个结构为:

的xml文件
<?xml version="1.0"?>
<api>
  <parse title="Article Title">
    <text xml:space="preserve">Text you wanted goes here</text>
  </parse>
</api>

请注意变量:page=Article_Title_Goes_Here format=xml prop=text

答案 1 :(得分:-3)

我会使用file_get_contents('http://wikipedia.com/'.$rest_of_url)

然后只需使用字符串解析来选择所有形式

http://php.net/manual/en/function.substr.php