使用Wikipedia Python库检索k个最相关文章背后的方法是什么?

时间:2018-05-04 06:52:52

标签: python wikipedia information-retrieval

Wikipedia python库是否会根据给定的查询自动检索最相关的k文档?检索这些文档的底层结构是什么?它是使用TF-IDF还是其他任何方法?

1 个答案:

答案 0 :(得分:1)

the module's source code可以看出,wikipedia查询Wikipedia API并返回其结果。因此,返回的文档的顺序由维基百科自己的 CirrusSearch 确定,该是基于Elasticsearch构建的。您可以找到更多信息in the Wikipedia API documentation