在Lucene中索引时保留首字母缩略词的点

时间:2009-07-18 21:37:58

标签: lucene lucene.net

如果我想让Lucene保留首字母缩略词(例如:英国,美国等),我需要使用哪种分析仪? 我还想在这样做时向Lucene输入一组停用词。

2 个答案:

答案 0 :(得分:2)

WhiteSpaceAnalyzer会保留点。 StopFilter删除停用词列表。您应该准确定义所需的分析,然后组合分析器和令牌过滤器来实现它,或write your own analyzer

答案 1 :(得分:0)

StandardTokenizer保留字母之间出现的点。您可以使用StandardAnalyzer,它使用StandardTokenizer。或者您可以使用StandardTokenizer创建自己的分析器。

更正:StandardAnalyzer没有帮助,因为它使用StandardFilter,它从首字母缩略词中删除了点。您可以使用StandardTokenizer和其他过滤器(例如小写过滤器)减去StandardFilter来构建您自己的分析器。