我已经查看了有关此问题的其他问题,但这似乎无济于事。
我必须在Elasticsearch中更改输入“ i phone”或“ i Phone”才能查询“ iPhone”。
如您所见,我已经尝试了大多数我能想到的一切,包括简单地使用“ phone => iPhone”,然后将“ i”保留在那里并可能将其添加到停用词中。
我尝试为自定义分析器使用“简单”,“关键字”,“标准”和“空白”。
任何人都可以发现我出了问题的地方,这是我无法完成项目之前的最后一个问题,因此不胜感激。谢谢
P.S。奖励积分,如果您包括我如何对输入内容进行自动建议,谢谢
下面是我的代码
public static CreateIndexDescriptor GetMasterProductDescriptor(string indexName = "shopmaster")
{
var indexDescriptor = new CreateIndexDescriptor(indexName)
.Settings(s => s
.Analysis(a => a
.TokenFilters(t => t
.Stop("my_stop", st => st
.StopWords("_english_", "new", "cheap")
.RemoveTrailing()
)
.Synonym("my_synonym", st => st
.Synonyms(
"phone => iPhone"
//"i phone => iPhone",
//"i Phone => iPhone"
)
)
.Snowball("my_snowball", st => st
.Language(SnowballLanguage.English)
)
)
.Analyzers(an => an
.Custom("my_analyzer", ca => ca
.Tokenizer("simple")
.Filters(
"lowercase",
"my_stop",
"my_snowball",
"my_synonym"
)
)
)
)
)
.Mappings(
ms => ms.Map<MasterProduct>(
m => m.AutoMap()
.Properties(
ps => ps
.Nested<MasterProductAttributes>(p => p.Name(n => n.MasterAttributes))
.Nested<MasterProductAttributes>(p => p.Name(n => n.ProductAttributes))
.Nested<MasterProductAttributeType>(p => p.Name(n => n.MasterAttributeTypes))
.Nested<Feature>(p => p.Name(n => n.Features))
.Nested<RelatedProduct>(p => p.Name(n => n.RelatedProducts))
.Nested<MasterProductItem>(
p => p.Name(
n => n.Products
)
.Properties(prop => prop.Boolean(
b => b.Name(n => n.InStock)
))
)
.Boolean(b => b.Name(n => n.InStock))
.Number(t => t.Name(n => n.UnitsSold).Type(NumberType.Integer))
.Text(
tx => tx.Name(e => e.ManufacturerName)
.Fields(fs => fs.Keyword(ss => ss.Name("manufacturer"))
.TokenCount(t => t.Name("MasterProductId")
.Analyzer("my_analyzer")
)
)
.Fielddata())
//.Completion(cm=>cm.Analyzer("my_analyser")
)
)
);
return indexDescriptor;
}
答案 0 :(得分:0)
过滤器的顺序很重要!
您要应用小写字母,然后是词干(雪球),然后是同义词。您的同义词包含大写字母,但是在应用大写字母时,已经出现了小写。最好先使用小写字母,以确保大小写不影响同义词的匹配,但在这种情况下,替换的内容不应该使用大写字母。
不应在同义词之前应用词干(除非您知道自己在做什么,并且正在比较词干后的术语)。我相信Snowball会将“ iphone”转换为“ iphon”,因此这是您遇到麻烦的另一个领域。
"lowercase",
"my_synonym",
"my_stop",
"my_snowball",
(而且请不要忘记删除同义词中的大写字母)