我索引了一个单词列表,例如'just saw','just passed','just met'..我有一个句子列表,我想只提取那些包含这些关键词的句子。例如 “我刚看了一部电影”。但是我不想要那些像“我在美国并遇到奥巴马”的句子。我只想要那些有连续关键词的句子。我怎么能用luence
来做到这一点答案 0 :(得分:2)
Lucene支持在特定距离内找到单词。要进行邻近搜索,请使用短语末尾的波浪号“〜”符号。例如,要在文档中搜索彼此10个单词内的“apache”和“jakarta”,请使用搜索:
"jakarta apache"~10
答案 1 :(得分:1)
还有SpanQuery可以很好地控制术语的顺序。