使用Lucene.Search进行精确的字符串匹配

时间:2009-12-31 07:09:39

标签: full-text-search lucene.net

有人能告诉我一个关于PhraseQuery如何在Lucene.Net中运行的例子。

我正在构建一个实用程序,它将扫描由数千个单词,rtf文档创建的Lucene索引,并将搜索行的精确匹配。

例如,如果我搜索“快速棕色狐狸跳过懒狗”,搜索应返回上述行作为其内容的一部分的文档编号。

为了总结我到目前为止所做的事情,我正在使用SimpleAnalyzer构建一个Lucene索引并使用相同的分析器类型进行搜索。为了搜索我正在使用IndexSearcher并使用MultiFieldQueryParser来解析要搜索的行。

代码工作正常,但没有得到理想的结果。

请任何人帮助我找出我做错了什么。

提前致谢

1 个答案:

答案 0 :(得分:1)

使用StandardAnalyzer (根据识别的复杂语法对文本进行标记:电子邮件地址;首字母缩略词;中文,日文和韩文字符;字母数字;等等 以小写形式放置文本 删除停用词)而不是SimpleAnalyzer (将文本除以非字母字符并将文本置于小写)用于索引。

如果您想找到名为“正确的方式”的文件,您可以输入标题:“正确的方式”