使用JQ从JSON中选择特定的,任意嵌套的对象

时间:2017-12-19 16:25:06

标签: json object select nested jq

我正在寻找有效的方法来搜索大型JSON对象以寻找与过滤器相匹配的“子对象”(我想通过select())。但是,顶级JSON是包含任意嵌套的对象,包括更简单的值,对象和对象数组。例如:

{
  "name": "foo",
  "class": "system",
  "description": "top-level-thing",
  "configuration": {
    "status": "normal",
    "uuid": "id"
  },
  "children": [
    {
      "id": "c1",
      "class": "c1",
      "children": [
        {
          "id": "c1.1",
          "class": "c1.1"
        },
        {
          "id": "c1.1",
          "class": "FINDME"
        }
      ]
    },
    {
      "id": "c2",
      "class": "FINDME"
    }
  ],
  "thing": {
    "id": "c3",
    "class": "FINDME"
  }
}    

我有一个解决方案 我想要的东西(并且可以理解):

jq -r '.. | arrays | .[] | select(.class=="FINDME"?) | .id'

返回:

c2
c1.1

...但是,它错过了c3,而且它改变了输出项目的顺序。此外,我希望这可以在可能非常大的JSON结构上运行,我想确保找到一个有效的解决方案。 jq新手(包括我自己)可以读取的内容的奖励积分。

FWIW,我用它来帮助我的参考资料,以防他们帮助他人:

2 个答案:

答案 0 :(得分:2)

这是一个流解析器解决方案。要弄清楚它,你需要阅读--stream选项,但关键是输出包括以下形式的行:[PATH,VALUE]

program.jq

foreach inputs as $in (null;
  if has("id") and has("class") then null
  else . as $x
  | $in
  | if length != 2 then null
    elif .[0][-1] == "id" then ($x + {id: .[-1]})
    elif .[0][-1] == "class"
         and .[-1] == "FINDME" then  ($x + {class: .[-1]})
    else $x
    end
  end;
  select(has("id") and has("class")) | .id )

调用

jq -n --stream -f program.jq input.json

带样本输入的输出

"c1.1"
"c2"
"c3"

答案 1 :(得分:1)

对于小到中等大小的JSON输入,您使用..走在正确的轨道上 但似乎你想选择objects,如下:

.. | objects | select(.class=="FINDME"?) | .id

对于非常大的JSON文档,这可能需要太多内存,因此可能需要了解jq的流解析器。不幸的是,它使用起来要困难得多,所以我建议尝试以上操作,如果您有兴趣,请查看常用的--stream选项文档。