使用Whoosh Python搜索库进行文档比较/相似性

时间:2012-01-25 21:36:22

标签: python search whoosh

如何使用Whoosh获取文档的相似性度量?

我想创建一个“相关”功能,该功能可以对与文档具有高度相似性的其他先前索引的文档进行排名。

我是否将文档作为长查询字符串输入?我是否将文档添加到索引并从那里以某种方式提取相似性查询结果?

谢谢

1 个答案:

答案 0 :(得分:1)

Whoosh搜索者类有一个名为'more_like()'的方法。

它允许您将文档与其他索引文档进行比较和索引,并返回与给定文档类似的文档列表。

class whoosh.searching.Hit可以给出排名和分数。