维基百科api:仅解析引言

时间:2011-03-18 16:44:24

标签: php wikipedia wikipedia-api

使用PHP,是否有一种很好的方法可以从维基百科页面获取(解析的)

我必须采用当前的方法:

  • 第一个是调用api页面并返回,然后根据我从第一个请求中提取的介绍调用Wiki解析器(两个请求,从文本中提取介绍也不是很好)。
  • 第二种是调用整个页面解析器并使用xpath检索内容表之前的每个<p>标记。

使用这两种方法,我必须重新解析HTML,以确保介绍链接中的相关链接关闭到维基百科。

两者都不是理想的,必须有更好的方法吗?

1 个答案:

答案 0 :(得分:1)

action=parse API模块接受节号参数like this。引线为0号部分。