Lucene中的相似函数

时间:2014-04-18 01:28:50

标签: java lucene similarity

我是Lucene的新人。我建了一个由4个字段组成的索引。在其中的两个中,我使用NGrams进行标记化,但现在我需要一个良好的相似性函数来检索具有有用分数的文档。

特别是我想实现Jaccard Similarity。 Lucene中没有这种相似性的适用实现。 要实现这个简单函数的覆盖方法是哪些? 我可以扩展DefaultSimilarity吗?

我在网上冲浪,但很难弄清楚如何创建新的相似性。

谢谢大家的回答。

0 个答案:

没有答案