Java Lucene从Document对象获取术语

时间:2011-09-17 07:16:23

标签: java lucene

我理解如何从Term对象获取文档集,但是您可以反过来从Document对象中获取术语/术语频率吗?

1 个答案:

答案 0 :(得分:1)

是的,可以从文档中获取条款,但没有简单的API。 IndexReader有一个方法getTermFreqVector,您可以在其中检索文档中的术语。您需要构建自定义TermVectorMapper并将其传递getTermFreqVector().在自定义TVMapper中,术语及其频率将以map()方法收集。 getTermFreqVector()返回后,可以从自定义TVMapper中检索字词。