我正在处理Elasticsearch的简历数据库。有嵌套的字段。例如,有一个“技能”部分。 “技能”是一个包含“技能”和“年”的嵌套字段。我希望能够进行查询以返回某年的技能。例如,我想获取具有3年或以上“ python”经验的人的简历。
我已经成功运行了执行以下操作的查询:
它返回所有具有“ python作为kills.skill和3作为kills.year的简历。 只要python与2年或3年以上的经验相关联,就会返回结果。
GET /resumes/_search
{
"query": {
"bool": {
"must": [
{ "match": { "skills.skill": "python" }},
{ "match": { "skills.years": 3 }}
]
}
}
}
是否存在更好的方法来对3与python相关联的数据进行排序?
答案 0 :(得分:0)
您需要使用Nested DataType并与之相对应,您需要使用Nested Query
您当前使用的模型似乎是basic object model。
我在下面提到了示例映射,示例文档,嵌套查询和响应。这将为您提供所需的东西。
PUT resumes
{
"mappings": {
"mydocs": {
"properties": {
"skills": {
"type": "nested",
"properties": {
"skill": {
"type": "keyword"
},
"years": {
"type": "integer"
}
}
}
}
}
}
}
POST resumes/mydocs/1
{
"skills": [
{
"skill": "python",
"years": 3
},
{
"skill": "java",
"years": 3
}
]
}
POST resumes/mydocs/2
{
"skills": [
{
"skill": "python",
"years": 2
},
{
"skill": "java",
"years": 3
}
]
}
POST resumes/_search
{
"query": {
"nested": {
"path": "skills",
"query": {
"bool": {
"must": [
{
"match": {
"skills.skill": "python"
}
},
{
"match": {
"skills.years": 3
}
}
]
}
}
}
}
}
{
"took": 1,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 1,
"max_score": 1.6931472,
"hits": [
{
"_index": "resumes",
"_type": "mydocs",
"_id": "1",
"_score": 1.6931472,
"_source": {
"skills": [
{
"skill": "python",
"years": 3
},
{
"skill": "java",
"years": 3
}
]
}
}
]
}
}
请注意,您在上述响应中仅检索ID为1
的文档。另请注意,为简单起见,我将Skills.skill设置为keyword
类型。您可以根据用例将其更改为text
。
希望有帮助!