我正在寻找有效的方法来搜索大型JSON对象以寻找与过滤器相匹配的“子对象”(我想通过select()
)。但是,顶级JSON是包含任意嵌套的对象,包括更简单的值,对象和对象数组。例如:
{
"name": "foo",
"class": "system",
"description": "top-level-thing",
"configuration": {
"status": "normal",
"uuid": "id"
},
"children": [
{
"id": "c1",
"class": "c1",
"children": [
{
"id": "c1.1",
"class": "c1.1"
},
{
"id": "c1.1",
"class": "FINDME"
}
]
},
{
"id": "c2",
"class": "FINDME"
}
],
"thing": {
"id": "c3",
"class": "FINDME"
}
}
我有一个解决方案 我想要的东西(并且可以理解):
jq -r '.. | arrays | .[] | select(.class=="FINDME"?) | .id'
返回:
c2
c1.1
...但是,它错过了c3
,而且它改变了输出项目的顺序。此外,我希望这可以在可能非常大的JSON结构上运行,我想确保找到一个有效的解决方案。 jq
新手(包括我自己)可以读取的内容的奖励积分。
FWIW,我用它来帮助我的参考资料,以防他们帮助他人:
答案 0 :(得分:2)
这是一个流解析器解决方案。要弄清楚它,你需要阅读--stream
选项,但关键是输出包括以下形式的行:[PATH,VALUE]
foreach inputs as $in (null;
if has("id") and has("class") then null
else . as $x
| $in
| if length != 2 then null
elif .[0][-1] == "id" then ($x + {id: .[-1]})
elif .[0][-1] == "class"
and .[-1] == "FINDME" then ($x + {class: .[-1]})
else $x
end
end;
select(has("id") and has("class")) | .id )
jq -n --stream -f program.jq input.json
"c1.1"
"c2"
"c3"
答案 1 :(得分:1)
对于小到中等大小的JSON输入,您使用..
走在正确的轨道上
但似乎你想选择objects
,如下:
.. | objects | select(.class=="FINDME"?) | .id
对于非常大的JSON文档,这可能需要太多内存,因此可能需要了解jq的流解析器。不幸的是,它使用起来要困难得多,所以我建议尝试以上操作,如果您有兴趣,请查看常用的--stream
选项文档。