我有两个带有多个json对象的json文件。 我想通过将jq与group_by(.id)结合使用来在Linux上合并两个json文件 实际上,我不需要使用jq,但是我需要制作linux shell脚本文件。
我当然尝试了很多解决方案,但是它们并没有完全按照我想要的方式工作。
输入1:file1.json
{"id":"1234", "branch": "master", "arr":["say", "one", "more"]}
{"id":"102", "branch": "master", "arr":["yes"]}
{"id":"1228", "branch": "master"}
输入2:file2.json
{"id":"1234", "branch": "dev", "other": "value", "arr":["what"]}
{"id":"102", "branch": "dev"}
{"id":"0806", "branch": "master"}
我期望的是
{"id":"1234", "branch": ["master", "dev"], "other": "value", "arr":["say", "one", "more", "what"]}
{"id":"102", "branch": ["master", "dev"], "arr":["yes"]}
{"id":"1228", "branch": "master"}
{"id":"0806", "branch": "master"}
但是实际输出就像
{"id":"1234", "branch": "dev", "other": "value", "arr":["what"]}
{"id":"102", "branch": "dev"}
{"id":"0806", "branch": "master"}
答案 0 :(得分:2)
下面,我们使用通用函数combine
来组合两个对象,如下所示。
具有此功能,并使用如下调用:
jq -n -f combine.jq --slurpfile f1 file1.json --slurpfile f2 file2.json
并假设您的jq具有INDEX/2
,则只需编写以下内容即可获得解决方案:
INDEX( $f1[]; .id) as $d1
| INDEX( $f2[]; .id) as $d2
| reduce (($d1+$d2)|keys_unsorted)[] as $id
({}; .[$id] = ($d1[$id] | combine($d2[$id])) )
| .[]
也就是说,我们为两个文件中的每个文件构造一个字典,然后将对象组合到相应的键处,然后生成所需的流。
如果您安装的jq没有INDEX/2
,那么现在是升级的好时机,但是另一种方法是从buildin.jq复制其def(请参见下面的“注释”)。
在下面的版本(适用于jq 1.5或更高版本)中,合并值的详细信息留给内部函数aggregate
。
# Combine . with obj using aggregate/2 for shared keys whose values differ
def combine($obj):
# Combine two entities in an array-oriented fashion:
# if both are arrays: a + b
# else if a is an array: a + [b]
# else if b is an array: [a] + b
# else [a, b]
def aggregate(a; b):
if (a|type) == "array" then
if (b|type) == "array" then a + b
else a + [b]
end
else
if (b|type) == "array" then [a] + b
else [a, b]
end
end;
if . == null then $obj
elif $obj == null then .
else reduce ($obj|keys_unsorted[]) as $key (.;
if .[$key] == $obj[$key] then .
else .[$key] = if has($key) and ($obj|has($key))
then aggregate( .[$key]; $obj[$key] )
else .[$key] + $obj[$key]
end
end )
end ;