标签: lucene
因为我已经阅读了lucene 4.0的文档,现在这个库存储了一些统计数据,以便计算不同的评分模型,其中一个是bm25。除了获取文档之外,还有一种方法可以获取它的长度吗?
答案 0 :(得分:2)
你可以将你想要的任何东西从FieldInvertState存储到'norm'中,它也不一定是8位浮点数。
默认是长度的有损存储,如果你想要实际的确切长度,也许你选择使用每个文档的短(16位)或其他东西。
参见Similarity.computeNorm