我想在Lucene处理撇号。让我们举个例子。我有以下句子:" L' arbre est vert"。我想知道如何在单词" arbre"上创建一个查询。 '没有撇号)。使用StandardAnalyzer,我需要编写" L' arbre"得到肯定答案。
请注意,此处有一个问题:Lucene Indexing to ignore apostrophes。但由于我在Lucene中很新,我想有一个例子(在Lucene 5.3中有效的代码片段)。
答案 0 :(得分:0)
看起来你需要对法语进行更强大的分析。我会考虑使用FrenchAnalyzer。 StandardAnalyzer旨在提供可通过语言无关的分析。如果您想要对特定语言进行更智能的语言分析,您应该向分析器查找该语言。
对于“L'arbre est vert”,StandardAnalyzer将其标记为:
FrenchAnalyzer给你的地方:
答案 1 :(得分:0)
正如@femtoRgon指出的那样,您需要通过更合适的分析来满足这一需求。您可以根据特定文档/查询的语言更改字段的分析器,也可以选择更高级的策略作为使用特定于语言的索引或字段。
请查看Multilingual Search using Lucene,了解可能的策略概述。