如何在Vespa的YQL查询的搜索响应中获取结构类型映射的子字段?

时间:2019-01-02 08:54:33

标签: yql vespa

样本数据:

"fields": {
    "key1":0,
    "key2":"no",
    "Lang": {
        "en": {
            "firstName": "Vikrant",
            "lastName":"Thakur"
        },
        "ch": {
            "firstName": "维克兰特",
            "lastName":"塔库尔"
        }
    }
}

预期的响应:

"fields": {
  "Lang": {
      "en": {
          "firstName": "Vikrant",
          "lastName":"Thakur"
       }
  }
}

我在搜索定义 demo.sd 中添加了以下内容:

struct lang {
  field firstName type string {}
  field lastName type string {}
}

field Lang type map <string, lang> {
  indexing: summary
  struct-field key {
    indexing: summary | index | attribute
  }
}

我想写一个类似这样的yql查询(这不起作用):

http://localhost:8080/search/?yql=select Lang.en from sources demo where key2 contains 'no';

我的临时解决方法

我在 MySearcher.java 中实现了一个自定义搜索器,通过它可以提取所需的子字段并设置一个新字段“ defaultLang”,然后删除“ Lang”字段。搜索者生成的响应:

"fields": {
  "defaultLang": {
      "firstName": "Vikrant",
      "lastName":"Thakur"
  }
}

我已经在MySearcher.java中编写了以下内容:

for (Hit hit: result.hits()) {
    String language = "en";  //temporarily hard-coded
    StructuredData Lang = (StructuredData) hit.getField("Lang");
    Inspector o = Lang.inspect();
    for (int j=0;j<o.entryCount();j++){
        if (o.entry(j).field("key").asString("").equals(language)){
            SlimeAdapter value = (SlimeAdapter) o.entry(j).field("value");
            hit.setField("defaultLang",value);
            break;
        }
    }
    hit.removeField("Lang");
}

Edit-1:一种更有效的方法是像上面一样使用Inspectable界面和Inspector(感谢@Jo Kristian Bergum)

但是,在上面的代码中,我不得不遍历所有语言以筛选出所需的语言。我想避免这种O(n)时间复杂性,并利用映射结构在O(1)中对其进行访问。 (因为语言可能会增加到1000,所以每次点击都会这样做。)

所有这些都是由于我在结果中得到的 StructuredData 数据类型。 StructureData不保留地图结构,而是提供如下的JSON数组:

[{
  "key": "en",
  "value": {
    "firstName": "Vikrant",
    "lastName": "Thakur"
  }
}, {
  "key": "ch",
  "value": {
    "firstName": "维克兰特",
    "lastName": "塔库尔"
  }
}]

请提出一个更好的方法,或者对我目前的方法有所帮助。两者都很感激。

1 个答案:

答案 0 :(得分:3)

我猜想YQL示例查询是为了说明您想要的语法无效。可以像在搜索器中一样从类型映射的Lang字段中选择给定键,但是反序列化为JSON并解析JSON可能效率不高,因为StructuredData实现了Inspectable接口,您可以直接检查它而无需通过JSON格式。参见https://docs.vespa.ai/documentation/reference/inspecting-structured-data.html