我已将大型pdf文件编入索引弹性搜索引擎。我用雪球分析仪分析了这个非结构化数据。这可以转换像" running"到"跑"使用雪球过滤器。但是,如果我想要搜索单词"运行"?这对我没有帮助。
我不能使用其他字段,因为这些是较大的文件,并且可以在更大程度上增加索引大小。
那么如何使用雪球过滤器来使用" preserver_original"之类的东西。所以我可以保留原始单词和词干。
有没有办法或替代方法按照我的要求分析这个领域?
答案 0 :(得分:1)
你可以使用"原位干预": https://www.elastic.co/guide/en/elasticsearch/guide/current/stemming-in-situ.html