我想模仿这种类型的Solr查询:
http://wiki.apache.org/solr/MoreLikeThis
使用PostgreSQL的全文搜索工具。
有没有办法用纯粹的postgres做一个像“更像这样”的查询?
答案 0 :(得分:1)
恐怕不是开箱即用的。有可能比较两个tsvectors以确定它们是否足够相似,或者拉出前n个类似的tsvector,但是没有开箱即用的功能来做到这一点。好消息是,由于tsvectors支持GIN索引,因此复杂的部分就是为您完成的。
我认为你需要做的是在C中创建一个函数来确定两个tsvector的交集。从那里你可以创建一个函数来确定它们是否重叠,以及一个解决它的运算符。从那里开始基于最大重叠创建排名应该不会太难。
当然我怀疑用C这样的语言最容易做到这一点,但如果你需要,你也可以使用其他程序语言。
PostgreSQL的精彩之处在于一切皆有可能。当然,缺点是,当你从核心功能进一步发展时,你可以自己做很多事情。