Question

我们说A，B，C是同义词，我想定义B比A更接近C而不是A

因此，当我搜索关键字A时，在搜索结果中，B成为第一个，C成为第二个，{{1}}成为最后一个。

任何帮助？

Answer 1

没有搜索时机制（截至目前）来区分同义词和源字段的匹配。这是因为，在编入索引时，字段的同义词会与原始术语一起放入倒排索引中，使所有单词保持相同。

这并不是说你不能在索引时做一些魔法来收集你想要的信息。

使用两个分析器创建索引：一个带有同义词过滤器，另一个没有。

PUT /synonym_test/
{
settings : {
  analysis : {
    analyzer : {
      "no_synonyms" : {
        tokenizer : "lowercase"
      },
      "synonyms" : {
        tokenizer : "lowercase",
        filter : ["synonym"]
      }
     },
     filter : {
       synonym : {
         type : "synonym",
         format: "wordnet",
         synonyms_path: "prolog/wn_s.pl"
        }
      }
   }
  }
}

使用多字段映射，以便将感兴趣的字段编入索引两次：

PUT /synonym_test/mytype/_mapping
{
   "properties":{
     "mood": {
       "type": "multi_field",
       "fields" : {
          "syn" : {"type" : "string", "analyzer" : "synonyms"},
          "no_syn" : {"type" : "string", "analyzer" : "no_synonyms"}
       }
     }
   }

}

索引测试文档：

POST /synonym_test/mytype/1
{
  mood:"elated"
}

在搜索时，提高该字段的点击得分，没有同义词。

GET /synonym_test/mytype/_search
{
  query: {
    bool: {
      should: [
          { match: { "mood.syn" : { query: "gleeful", "boost": 3 } } },
          { match: { "mood.no_syn" : "gleeful" } }
      ]
    }
  }

}

_score＆＃34;：0.2696457

中的结果

搜索原始字词会获得更好的分数：

GET /synonym_test/mytype/_search
{
  query: {
    bool: {
      should: [
          { match: { "mood.syn" : { query: "elated", "boost": 3 } } },
          { match: { "mood.no_syn" : "elated" } }
      ]
    }
  }

}

结果： _score＆＃34;：0.6558018，＆＃34;

elasticsearch：我可以用boost定义同义词吗？

1 个答案: