标签: java lucene similarity
我是Lucene的新人。我建了一个由4个字段组成的索引。在其中的两个中,我使用NGrams进行标记化,但现在我需要一个良好的相似性函数来检索具有有用分数的文档。
特别是我想实现Jaccard Similarity。 Lucene中没有这种相似性的适用实现。 要实现这个简单函数的覆盖方法是哪些? 我可以扩展DefaultSimilarity吗?
我在网上冲浪,但很难弄清楚如何创建新的相似性。
谢谢大家的回答。