想出一个搜索算法来搜索文档

时间:2017-04-07 10:04:34

标签: python algorithm search pattern-matching computer-science

我正在开展一个项目,我需要在数据库中存在的与任何查询相关的所有文档(pdf / docs等)中进行搜索。 我之前使用了一个简单的关系,我存储了与文档关联的相关关键字,如果查询包含这些关键字,那么我会获取这些文档。但是这种方法并不可靠,因为这些关键字可能会产生误导。我需要在文档中搜索,我正在寻找一种可以很好地扩展并且时间复杂度较低的实用搜索算法。 任何建议和资源都是最受欢迎的。 谢谢。

1 个答案:

答案 0 :(得分:0)

尝试Rabin-Karp(基于哈希码)搜索算法。由于您必须在许多文档中搜索多个模式,因此它将获取所有模式的哈希码,并将一次查找所有模式。