Elasticsearch同义词问题

时间:2018-09-18 13:37:48

标签: elasticsearch lucene nest

我已经查看了有关此问题的其他问题,但这似乎无济于事。

我必须在Elasticsearch中更改输入“ i phone”或“ i Phone”才能查询“ iPhone”。

如您所见,我已经尝试了大多数我能想到的一切,包括简单地使用“ phone => iPhone”,然后将“ i”保留在那里并可能将其添加到停用词中。

我尝试为自定义分析器使用“简单”,“关键字”,“标准”和“空白”。

任何人都可以发现我出了问题的地方,这是我无法完成项目之前的最后一个问题,因此不胜感激。谢谢

P.S。奖励积分,如果您包括我如何对输入内容进行自动建议,谢谢

下面是我的代码

public static CreateIndexDescriptor GetMasterProductDescriptor(string indexName = "shopmaster")
        {
            var indexDescriptor = new CreateIndexDescriptor(indexName)
                .Settings(s => s
                            .Analysis(a => a
                                .TokenFilters(t => t
                                    .Stop("my_stop", st => st
                                        .StopWords("_english_", "new", "cheap")
                                        .RemoveTrailing()
                                    )
                                    .Synonym("my_synonym", st => st
                                        .Synonyms(
                                            "phone => iPhone"
                                        //"i phone => iPhone",
                                        //"i Phone => iPhone"
                                        )
                                    )
                                    .Snowball("my_snowball", st => st
                                        .Language(SnowballLanguage.English)
                                    )
                                )
                                .Analyzers(an => an
                                    .Custom("my_analyzer", ca => ca
                                        .Tokenizer("simple")
                                        .Filters(
                                            "lowercase",
                                            "my_stop",
                                            "my_snowball",
                                            "my_synonym"
                                        )
                                    )
                                )
                            )
                        )
                .Mappings(
                    ms => ms.Map<MasterProduct>(
                        m => m.AutoMap()
                            .Properties(
                                ps => ps
                                    .Nested<MasterProductAttributes>(p => p.Name(n => n.MasterAttributes))
                                    .Nested<MasterProductAttributes>(p => p.Name(n => n.ProductAttributes))
                                    .Nested<MasterProductAttributeType>(p => p.Name(n => n.MasterAttributeTypes))
                                    .Nested<Feature>(p => p.Name(n => n.Features))
                                    .Nested<RelatedProduct>(p => p.Name(n => n.RelatedProducts))
                                    .Nested<MasterProductItem>(
                                        p => p.Name(
                                                n => n.Products
                                            )
                                            .Properties(prop => prop.Boolean(
                                                b => b.Name(n => n.InStock)
                                            ))
                                    )
                                    .Boolean(b => b.Name(n => n.InStock))
                                    .Number(t => t.Name(n => n.UnitsSold).Type(NumberType.Integer))
                                    .Text(
                                        tx => tx.Name(e => e.ManufacturerName)
                                            .Fields(fs => fs.Keyword(ss => ss.Name("manufacturer"))
                                                    .TokenCount(t => t.Name("MasterProductId")
                                                            .Analyzer("my_analyzer")
                                                    )
                                            )
                                            .Fielddata())
                                    //.Completion(cm=>cm.Analyzer("my_analyser")
                                    )
                    )
                );
            return indexDescriptor;
        }

1 个答案:

答案 0 :(得分:0)

过滤器的顺序很重要!

您要应用小写字母,然后是词干(雪球),然后是同义词。您的同义词包含大写字母,但是在应用大写字母时,已经出现了小写。最好先使用小写字母,以确保大小写不影响同义词的匹配,但在这种情况下,替换的内容不应该使用大写字母。

不应在同义词之前应用词干(除非您知道自己在做什么,并且正在比较词干后的术语)。我相信Snowball会将“ iphone”转换为“ iphon”,因此这是您遇到麻烦的另一个领域。

"lowercase",
"my_synonym",
"my_stop",
"my_snowball",

(而且请不要忘记删除同义词中的大写字母)