文件长度在lucene 4.0中

时间:2012-03-09 15:30:51

标签: lucene

因为我已经阅读了lucene 4.0的文档,现在这个库存储了一些统计数据,以便计算不同的评分模型,其中一个是bm25。除了获取文档之外,还有一种方法可以获取它的长度吗?

1 个答案:

答案 0 :(得分:2)

你可以将你想要的任何东西从FieldInvertState存储到'norm'中,它也不一定是8位浮点数。

默认是长度的有损存储,如果你想要实际的确切长度,也许你选择使用每个文档的短(16位)或其他东西。

参见Similarity.computeNorm