如果我想让Lucene保留首字母缩略词(例如:英国,美国等),我需要使用哪种分析仪? 我还想在这样做时向Lucene输入一组停用词。
答案 0 :(得分:2)
WhiteSpaceAnalyzer会保留点。 StopFilter删除停用词列表。您应该准确定义所需的分析,然后组合分析器和令牌过滤器来实现它,或write your own analyzer。
答案 1 :(得分:0)
StandardTokenizer保留字母之间出现的点。您可以使用StandardAnalyzer,它使用StandardTokenizer。或者您可以使用StandardTokenizer创建自己的分析器。
更正:StandardAnalyzer没有帮助,因为它使用StandardFilter,它从首字母缩略词中删除了点。您可以使用StandardTokenizer和其他过滤器(例如小写过滤器)减去StandardFilter来构建您自己的分析器。