C#NEST ElasticSearch Default_Search分析器

时间:2016-03-03 14:28:23

标签: c# search elasticsearch default nest

简而言之,我希望能够拥有一个仅用于搜索的分析器。排序应该使用默认的分析器。

通过添加此代码,我可以成功地使搜索按预期工作。当我搜索“be”时,我发现了“Bé”的东西。

        var an = new CustomAnalyzer();
        an.Tokenizer = "keyword";
        an.Filter = new List<string>();
        an.Filter.Add("standard");
        an.Filter.Add("lowercase");
        an.Filter.Add("ascii_folding");

        return await CreateIndexAsync(c => c
            .Index(_index)
            .Analysis(a => a.Analyzers(a1 => a1.Add("default", an)))
            .Analysis(a => a.TokenFilters(tf => tf.Add("ascii_folding", new AsciiFoldingTokenFilter { PreserveOriginal = true })))
        );

这导致我的排序也变成了ascii折叠。 一个 一个 B等等。

在这里阅读它看起来我应该能够应用我的分析器只搜索。 https://www.elastic.co/guide/en/elasticsearch/reference/1.4/analysis-analyzers.html#default-analyzers

“和default_search可用于配置将在搜索时使用的默认分析器”

如果我理解正确的话,我应该可以通过更改此行来应用我的分析器进行搜索。

            .Analysis(a => a.Analyzers(a1 => a1.Add("default_search", an)))

这完全打破了分析仪。搜索将按默认值进行,并且不会命中Bé。我在这里做错了什么想法?

这是我的要求

Request: {
  "from": 0,
  "size": 70,
  "_source": {
    "include": [
      "Name",
    ]
  },
  "query": {
    "bool": {
      "must": [
        {
          "wildcard": {
            "_all": {
              "value": "*be*"
            }
          }
        }
      ]
    }
  },
  "filter": {}
}

我在_all?

中使用通配符搜索不应该有任何问题

这是一个排序请求。问题是我的结果在这里按ascii折叠值排序(如果我使用默认分析器)

    Request: {
  "from": 0,
  "size": 70,
  "sort": [
    {
      "Name": {
        "order": "asc"
      }
    }
  ],
  "_source": {
    "include": [
      "Name"
    ]
  }
}

2 个答案:

答案 0 :(得分:1)

如果您始终在_all字段上执行搜索,则可以为此设置不同的分析器。

创建两个分析器,一个标准,一个使用ascii_folding。

var allAnalyzer = new CustomAnalyzer();
allAnalyzer.Tokenizer = "keyword";
allAnalyzer.Filter.Add("customasciifolding");

var defAnalyzer= new CustomAnalyzer();
defAnalyzer.Tokenizer = "keyword";
defAnalyzer.Filter = new List<string>();
defAnalyzer.Filter.Add("standard");

使用分析器创建索引。

return await CreateIndexAsync(c => c
            .Index(_index)
            .Analysis(a => a
                .Analyzers(a1 => a1
                    .Add("default", defAnalyzer)
                    .Add("customAll",allAnalyzer)
                )
                .TokenFilters(tf => tf.Add("customasciifolding", new AsciiFoldingTokenFilter { PreserveOriginal = true })
                )
            )
        );

然后当您将地图设置为以下

await _elasticClient.MapAsync<MyClass>(m => m
            .MapFromAttributes()
            .AllField(af => af.Analyzer("customAll"))
        );

答案 1 :(得分:0)

根据我的理解,您需要应用sorting,因为现在您的排序基于_score。 所以你的查询是通过通配符过滤,然后取决于得分(找到匹配的位置和结果的排序频率)

.Analysis(a => a.Analyzers(a1 => a1.Add("default_search", an)))

您可以这样做,因此您将使用ascii filter

将其设置为默认分析器

PS。问题更新后。 您应该使用multifield,因此您应该有一个未分析的分析字段。搜索分析,排序未分析