Elasticsearch使用空格嵌套通配符查询

时间:2015-04-19 10:36:40

标签: c# elasticsearch nest

简短版:

我想使用Nest编写一个弹性搜索查询来获取已编制索引的完整索引项(在我的案例中为ContentIndexables作为我的自定义类型)。该查询受[some string] + *的术语查询(即String.StartsWith(),其中[some string]可能包含或不包含空格。

这与CompletionSuggester不同,因为我需要检索完整对象而不是字符串建议。

到目前为止我尝试过的事情:

当我查询没有空格的文本时,使用下面的代码返回所需的输出。但是,如果我的搜索字词包含空格,则它不会返回预期结果。

以下是我搜索字段的方法:

var searchResults = _client.Search<ContentIndexable>(
            body =>
            body
                .Index(indexName)
                .Query(
                    query =>
                    query.QueryString(
                        qs => qs.
                                  OnFields(f => f.Title, f => f.TextContent)
                                  .Query(searchTerm + "*"))));

这是一个演示如何重现问题的单元测试:

indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
        {
            ContentId = Guid.NewGuid(),
            TextContent = "Some description",
            Title = "title"
        });

        indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
        {
            ContentId = Guid.NewGuid(),
            TextContent = "Some description",
            Title = "title that is long"
        });

        indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
        {
            ContentId = Guid.NewGuid(),
            TextContent = "Some description",
            Title = "title that likes"
        });

        indexService.IndexUserItemsSync(testGuid, IndexType.submission, new ContentIndexable
        {
            ContentId = Guid.NewGuid(),
            TextContent = "Some description",
            Title = "titlethat"
        });

        var searchResult = indexService.SearchUserItems(testGuid, IndexType.submission, 10, "title");
        Assert.IsNotNull(searchResult);
// this one works
        Assert.AreEqual(4, searchResult.Count());

        var searchResult2 = indexService.SearchUserItems(testGuid, IndexType.submission, 10, "title that");
        Assert.IsNotNull(searchResult2);
// this one does not!!! searchREsult2.Count() evaluates to 0
        Assert.AreEqual(2, searchResult2.Count());

如您所见,然后我输入&#34;标题&#34;,搜索返回空,而不是我希望返回的两行。

更新 更多信息: 我在我的类型ContentIndexable上创建了一个索引:

public class ContentIndexable : IIndexable
{
    public Guid ContentId { get; set; }
    public string Title { get; set; }
    public string TextContent { get; set; }
}

使用此代码:

_client.CreateIndex(
    indexName,
    descriptor =>
    descriptor.AddMapping<ContentIndexable>(
        m => m.Properties(
            p => p.Completion(s => s
                                       .Name(n => n.Title)
                                       .IndexAnalyzer("standard")
                                       .SearchAnalyzer("standard")
                                       .MaxInputLength(30)
                                       .Payloads()
                                       .PreserveSeparators()
                                       .PreservePositionIncrements())
                     .Completion(s => s.Name(n => n.TextContent)
                                          .IndexAnalyzer("standard")
                                          .SearchAnalyzer("standard")
                                          .MaxInputLength(50)
                                          .Payloads()
                                          .PreserveSeparators()
                                          .PreservePositionIncrements())
                 )));

我甚至试图在索引时或使用string.Replace(" ", @"\ ")查询时逃避空白,但这并没有帮助。

将搜索类型更改为外卡并没有帮助:

var searchResults = _client.Search<ContentIndexable>(
            body =>
            body
                .Index(indexName)
                .Query(
                    query => query.Wildcard(qd => qd.OnField(f => f.Title).Value(searchTerm + "*"))));

有谁知道我做错了什么?

请注意,我的CompletionSuggester版本适用于空格,但遗憾的是只返回字符串。我需要输出完整项才能获取ContentId。 MY CompletionSuggester实施:

public IEnumerable<string> GetAutoCompleteSuggestions(Guid userId, IndexType indexType, int size, string searchTerm)
    {
        string indexName = getIndexName(indexType, userId);

        var result = _client.Search<ContentIndexable>(
            body => body.Index(indexName)
                        .SuggestCompletion("content-suggest" + Guid.NewGuid(),
                                           descriptor => descriptor
                                                             .OnField(t => t.Title)
                                                             .Text(searchTerm)
                                                             .Size(size)));

        if (result.Suggest == null)
        {
            return new List<string>();
        }

        return (from suggest in result.Suggest
                from value in suggest.Value
                from options in value.Options
                select options.Text).Take(size);
    }

我知道我可以接受这些建议,获得全部价值(这将产生我期待的两个项目),然后使用我的第一个方法进行完整的术语匹配,但这需要对ElasticSearch进行2次单独调用(一个用于完整的建议者,第二个用于术语查询)但理想情况下我想在没有往返的情况下这样做。

非常感谢,

1 个答案:

答案 0 :(得分:3)

这是您如何处理Title字段问题的示例。

将您的映射更改为(或使用MultiField,但我无法找到将字段映射为字符串并在同一时间内完成的选项):

client.CreateIndex(indexName, i => i
    .AddMapping<ContentIndexable>(m => m
        .Properties(
            ps => ps
                .Completion(c => c.Name("title.completion")
                    .IndexAnalyzer("standard")
                    .SearchAnalyzer("standard")
                    .MaxInputLength(30)
                    .Payloads()
                    .PreserveSeparators()
                    .PreservePositionIncrements())
                .String(s => s.Name(x => x.Title).CopyTo("title.completion")))));

SuggestCompletion更改为

var result = client.Search<ContentIndexable>(body => body
    .Index(indexName)
    .SuggestCompletion("content-suggest" + Guid.NewGuid(),
        descriptor => descriptor
            .OnField(t => t.Title.Suffix("completion"))
            .Text("title")
            .Size(10)));

QueryString

var searchResponse = client.Search<ContentIndexable>(body => body
    .Index(indexName)
    .Query(query => query
        .QueryString(
            qs => qs
                .OnFields(f => f.Title.Suffix("completion"))
                .Query("title tha" + "*")
                .MinimumShouldMatchPercentage(100))));

此解决方案的问题在于我们为Title字段存储了两次数据。这就是为什么我之前提到使用MultiField会很棒的原因,但我无法使用NEST执行此操作。

希望这有帮助。