我正在使用Apache Solr进行电影名称搜索。
我已取消tf& idf通过隐藏DefaultSimilarity Lucene类并覆盖tf和idf函数。
我将通过一个例子阐述我的问题。 搜索"蓝色阴影"产生以下结果。
上述两份文件均获得相同的分数。
一点点调查指出了lucene在计算分数时使用的FieldNorm。对于上述两个文档,FieldNorm都是相同的。但是,它应该是不同的。
此外,我观察了以下内容,
当document_length为5时,fieldNorm为0.4325