我理解如何从Term对象获取文档集,但是您可以反过来从Document对象中获取术语/术语频率吗?
答案 0 :(得分:1)
是的,可以从文档中获取条款,但没有简单的API。 IndexReader有一个方法getTermFreqVector,您可以在其中检索文档中的术语。您需要构建自定义TermVectorMapper并将其传递getTermFreqVector().
在自定义TVMapper中,术语及其频率将以map()
方法收集。 getTermFreqVector()
返回后,可以从自定义TVMapper中检索字词。