如何通过使用公用密钥合并和附加两个json文件而不丢失其他数据

时间:2019-04-23 07:56:17

标签: json shell jq

我有两个带有多个json对象的json文件。 我想通过将jq与group_by(.id)结合使用来在Linux上合并两个json文件 实际上,我不需要使用jq,但是我需要制作linux shell脚本文件。

我当然尝试了很多解决方案,但是它们并没有完全按照我想要的方式工作。

输入1:file1.json

{"id":"1234", "branch": "master", "arr":["say", "one", "more"]}
{"id":"102", "branch": "master", "arr":["yes"]}
{"id":"1228", "branch": "master"}

输入2:file2.json

{"id":"1234", "branch": "dev", "other": "value", "arr":["what"]}
{"id":"102", "branch": "dev"}
{"id":"0806", "branch": "master"}

我期望的是

{"id":"1234", "branch": ["master", "dev"], "other": "value", "arr":["say", "one", "more", "what"]}
{"id":"102", "branch": ["master", "dev"], "arr":["yes"]}
{"id":"1228", "branch": "master"}
{"id":"0806", "branch": "master"}

但是实际输出就像

{"id":"1234", "branch": "dev", "other": "value", "arr":["what"]}
{"id":"102", "branch": "dev"}
{"id":"0806", "branch": "master"}

1 个答案:

答案 0 :(得分:2)

下面,我们使用通用函数combine来组合两个对象,如下所示。

具有此功能,并使用如下调用:

jq -n -f combine.jq --slurpfile f1 file1.json --slurpfile f2 file2.json

并假设您的jq具有INDEX/2,则只需编写以下内容即可获得解决方案:

INDEX( $f1[]; .id) as $d1
| INDEX( $f2[]; .id) as $d2
| reduce (($d1+$d2)|keys_unsorted)[] as $id
    ({}; .[$id] = ($d1[$id] | combine($d2[$id])) )
| .[]

也就是说,我们为两个文件中的每个文件构造一个字典,然后将对象组合到相应的键处,然后生成所需的流。

如果您安装的jq没有INDEX/2,那么现在是升级的好时机,但是另一种方法是从buildin.jq复制其def(请参见下面的“注释”)。

combine / 1

在下面的版本(适用于jq 1.5或更高版本)中,合并值的详细信息留给内部函数aggregate

# Combine . with obj using aggregate/2 for shared keys whose values differ
def combine($obj):

  # Combine two entities in an array-oriented fashion:
  # if both are arrays:  a + b 
  # else if a is an array: a + [b]
  # else if b is an array: [a] + b
  # else [a, b]
  def aggregate(a; b):
    if (a|type) == "array" then
      if (b|type) == "array" then a + b
      else a + [b]
      end
    else
      if (b|type) == "array" then [a] + b
      else [a, b]
      end
    end;

  if . == null then $obj
  elif $obj == null then .
  else reduce ($obj|keys_unsorted[]) as $key (.;
         if .[$key] == $obj[$key] then . 
         else .[$key] = if has($key) and ($obj|has($key))
                        then aggregate( .[$key]; $obj[$key] )
                        else .[$key] + $obj[$key]
                end
         end )
   end ;