我知道whoosh,但它不适用于SQL
,例如 MySQL 和 PostgreSQL 。
要使用Python
答案 0 :(得分:1)
建议您使用MySQL和PostgreaSQL的标准Python绑定从数据库中提取数据,然后以您需要的格式对这些数据进行索引。
这两个数据库本身都支持FULL TEXT SEARCH(由whoosh提供的功能) - 即您不需要任何第三方库在 MYSQL或POSTGRESQL中进行全文搜索。因此,使用这些数据库中的SQL工具在数据库环境中进行全文搜索
此外,正如您可能已经知道的那样 - 全文搜索引擎仅索引数据以进行有效的搜索和检索。他们永远不会自己抓取文件系统或数据存储 - 这意味着您必须编写自己的文件系统爬虫或数据库爬虫来从文件/表中提取数据,然后将它们存储在使用 whoosh <定义的搜索模式中/ strong>即可。
我还建议你看看 PyLucene 这是一个非常强大的文本搜索引擎 Lucene 的python端口。当然,从我记忆中看来,设置 PyLucene 有点牵扯,我从来没有在我的项目中尝试过。