查询维基百科

时间:2014-12-10 17:47:47

标签: nlp wikipedia wikipedia-api

我想查询两个或三个术语,以便在Wikipedia的条目中找到它们。具体来说,我试图查看某些术语是否在条目的第一段(摘要)中重复出现。可以直接或通过dbpedia。感谢

1 个答案:

答案 0 :(得分:2)

使用Mediawiki API,您可以找到包含这些关键字的文章。 试试API:Search文档。

为了做你想做的事情,你可能还需要找到那些包含这些关键词的文章,然后解析文本以检查它们是否在第一段。

有了这个:

?action=parse&page=Nicolas_Cage&prop=text&section=0

您可以获取网页第一部分的HTML(请参阅此post)。