在lucene中获取精确的短语索引

时间:2012-05-09 18:24:53

标签: java search lucene

我需要在lucene中获得精确短语的索引。我用这个单词的索引:

TermFreqVector termFreqVector = reader.getTermFreqVector(docId, "content");
TermPositionVector termPositionVector = (TermPositionVector) termFreqVector;
int termIndex = termFreqVector.indexOf(searcWord);

termFreqVector.indexOf(searcWord)会返回搜索词的索引。

问题是我需要搜索一个短语,并需要获取它的索引。如果我将一个短语传递给termFreqVector,它总是返回-1,但我100%确定该短语存在。这有什么解决方案吗?

1 个答案:

答案 0 :(得分:1)

您需要手动执行此操作。例如,如果您的短语为president obama,则需要找到i的所有位置president,其中偏移i+1的字词为obama