Lucene:在一个句子中搜索一组特定的连续单词

时间:2010-11-02 17:58:27

标签: lucene

我索引了一个单词列表,例如'just saw','just passed','just met'..我有一个句子列表,我想只提取那些包含这些关键词的句子。例如 “我刚看了一部电影”。但是我不想要那些像“我在美国并遇到奥巴马”的句子。我只想要那些有连续关键词的句子。我怎么能用luence

来做到这一点

2 个答案:

答案 0 :(得分:2)

Proximity Search in Lucene

Lucene支持在特定距离内找到单词。要进行邻近搜索,请使用短语末尾的波浪号“〜”符号。例如,要在文档中搜索彼此10个单词内的“apache”和“jakarta”,请使用搜索:

"jakarta apache"~10

答案 1 :(得分:1)

还有SpanQuery可以很好地控制术语的顺序。