我试图根据与我的查询匹配的同义词(不是令牌!)的百分比来为得分打分,例如:
假设字段name
由whitespace tokenizer
标记,并通过添加lowercase
和edge_ngram (3-10)
作为标记过滤器进一步分析标记,该查询将搜索“ Walt”这些文件存在
{
"name": "Walter"
},
{
"name": "Walt"
}
将对1 (2/2)
作为同义词"wal", "walt"
全部匹配的“沃尔特”和与0.5 (2/4)
同义的"wal", "walt", "walte", "walter
进行匹配的“沃尔特”仅与查询匹配2。
我似乎只能找到基于令牌计数而不是同义词的计分问题。 在评分环境中,是否可以轻松访问同义词的数量?这可以用弹性做吗?