我需要在lucene中获得精确短语的索引。我用这个单词的索引:
TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);
此termFreqVector.indexOf(searcWord)
会返回搜索词的索引。
问题是我需要搜索一个短语,并需要获取它的索引。如果我将一个短语传递给termFreqVector,它总是返回-1
,但我100%确定该短语存在。这有什么解决方案吗?
答案 0 :(得分:1)
您需要手动执行此操作。例如,如果您的短语为president obama
,则需要找到i
的所有位置president
,其中偏移i+1
的字词为obama
。