有没有一种从维基百科检索公司摘要的好方法?

时间:2015-07-06 22:33:37

标签: search wikipedia

我的问题不是解析。

我一直在浏览维基百科API。我需要搜索公司并获得一句话摘要。它运作良好,我唯一的问题是当我需要消除歧义时。我的代码很难知道" dropbox(service)"或" dropbox(乐队)"是我的用户正在寻找的Dropbox公司。 我试着说出" company"在查询中,期望它像谷歌搜索一样工作,但不幸的是它没有。

所以我的问题是:有没有一种简单的方法可以通过告诉维基百科它是一个"公司"来消除我得到的结果的歧义。我想要什么?

2 个答案:

答案 0 :(得分:0)

如果您正在寻找公司,那么请考虑使用全名而不是简短形式。对于Dropbox,该公司的名称是Dropbox,Inc。如果您在维基百科中搜索Dropbox,Inc,您将被重定向到Dropbox(服务)页面,我相信这是您正在寻找的页面。

如果您没有足够的资源以完美的格式提供公司名称,请考虑使用类别:公司进一步优化您的结果。

当您访问该页面时,您可以使用Mediawiki API挖掘公司的摘录,如下所示

https://en.wikipedia.org/w/api.php?format=json&action=query&prop=extracts&exintro=&explaintext=&titles=Dropbox%20(service)

注意:摘录在MediaWiki中被称为section0

答案 1 :(得分:0)

我建议尝试Wikidata。 Wikidata是一个包含所有内容的多语言事实数据库,并且在query.wikidata.org上具有查询界面。接口使用的语言称为SPARQL。例如,如果您对一系列知名的猫感兴趣,则https://w.wiki/W4W是您的查询。可以在https://www.wikidata.org/wiki/Wikidata:SPARQL_query_service上找到更多详细信息。