Lucene.NET:检索特定文档中使用的所有术语

时间:2010-03-09 10:28:31

标签: lucene lucene.net

有没有办法在Lucene.NET索引中浏览针对特定文档的所有术语?

基本上我希望能够根据它的ID从索引中检索文档,然后找到该文档中每个术语的使用频率。有谁知道这样做的方法?

我可以找到与特定条款匹配但不包含特定文档中包含的条款的文档数量。

非常感谢,

1 个答案:

答案 0 :(得分:3)

至少在Lucene Java中,索引文档时的一个选项是存储术语频率向量。术语频率向量只是文档给定字段中所有术语的列表,以及使用这些术语的频率。在运行时获取术语频率向量涉及使用相关文档的Lucene ID调用IndexReader中的方法。