标签: lucene indexing
我想知道Lucene分析器是否使用构建索引的tf-idf表示。
由于
答案 0 :(得分:2)
否:分析人员只是将文档分成一个令牌流。
IndexWriter是一个分析使用者,它构建一个倒排索引,记录原始统计信息,例如文档中出现的术语数量以及包含该术语的文档数量。
但这不是tf / idf表示:索引格式独立于评分模型。