标签: elasticsearch
由于特定的文档流程生成,我有一堆文档,其中包含格式错误的单词,其中包含空格。这些可能是搜索的重要词汇,目前我没有可能获得另一种格式的文档,所以,我想知道是否有任何方法可以索引文档并在查询中使用正确形成的单词找到它们时间。例如,我可以在索引文档中使用“ e ng i n er ”这个词,我想找到它键入“ engineer ”。 你知道在弹性搜索中实现这个任务的方法吗?
答案 0 :(得分:1)
我会尝试从NGram tokenizer开始。其中只标记数字和字母,因此即使使用空格也可以找到匹配项。