如何使用Postgresql全文搜索模拟Solr“更像这个查询”?

时间:2012-05-14 15:22:03

标签: postgresql solr

我想模仿这种类型的Solr查询:

http://wiki.apache.org/solr/MoreLikeThis

使用PostgreSQL的全文搜索工具。

有没有办法用纯粹的postgres做一个像“更像这样”的查询?

1 个答案:

答案 0 :(得分:1)

恐怕不是开箱即用的。有可能比较两个tsvectors以确定它们是否足够相似,或者拉出前n个类似的tsvector,但是没有开箱即用的功能来做到这一点。好消息是,由于tsvectors支持GIN索引,因此复杂的部分就是为您完成的。

我认为你需要做的是在C中创建一个函数来确定两个tsvector的交集。从那里你可以创建一个函数来确定它们是否重叠,以及一个解决它的运算符。从那里开始基于最大重叠创建排名应该不会太难。

当然我怀疑用C这样的语言最容易做到这一点,但如果你需要,你也可以使用其他程序语言。

PostgreSQL的精彩之处在于一切皆有可能。当然,缺点是,当你从核心功能进一步发展时,你可以自己做很多事情。