Lucene没有搜索完整的非ASCII字符

时间:2010-11-11 14:04:52

标签: lucene.net

我使用Lucene seacrh引擎进行全文搜索它也给出了非ascii字符的搜索结果但问题是假设我添加了一个文本帕普部分分配数量并将搜索 只有一个字符帕会给出结果但是什么时候会搜索完整的非ascii字帕普部分分配数量它没有给出任何结果,奇怪的是当我在每个字符之间放置空格例如帕普部分分配数量和theb将搜索它给结果

真的会感谢任何帮助

感谢名单

1 个答案:

答案 0 :(得分:0)

确保在编制索引和搜索时使用相同的Analyzer

您的Analyzer将每个字符编入索引为Term,然后如果您使用其他分析器(IE WhiteSpaceAnalyzer进行搜索),会搜索包含所有字符的令牌您的查询中指定的字符。

要搜索您想要的字符序列,您需要使用相同的Analyzer并让QueryParser与所有单个代币构建PhraseQuery

索引和搜索例程的一些示例代码可以让您更轻松地为您提供帮助。