我正在使用来自lucene的代码来自第1版和lucene版本1.4.3。我使用简单的分析器来分析txt文件中的“book book book”数据。但是,当我使用lukeall浏览数据时,排名列显示“book”只出现一次,而我预计它会为3.
答案 0 :(得分:0)
是什么让你觉得卢克的“排名”栏会显示这个词的出现次数?我相信0.9,Rank显示docfreq
,即该术语出现的文档数量(在更高版本中,“Rank”是顺序的,“Freq”提供该统计数据)。向索引添加更多数据可能会澄清这些统计数据的含义。