Python 2.7 - 获取两个JSON并将字符串字段值组合在一起并添加int字段

时间:2016-01-17 04:05:53

标签: python json python-2.7 dictionary bigdata

我正在尝试使用两个由整数和字符串组合组成的JSON,并使用python 2.7将它们组合在一起。

例如:

{"key": {"field_string": ["string"],"field_num": 1}}
{"key": {"field_string": ["another_string"],"field_num": 2}}

我要做的事情的要求是:

  • 密钥将是相同的,并且在合并后需要保持不变
  • 整数需要加在一起,所以1 + 2 = 3,字符串需要以数组格式加在一起(它们已经在上面的数组中)。
  • 每个JSON的一系列字段,大多数JSON将包含4-7个字段

根据上述内容,我希望输出看起来像一个例子:

{"key": {"field_string": ["string","another_string"],"field_num": 3}}

此外,我使用它的项目将在一台无法访问互联网的机器上,所以如果可能的话我需要使用标准的python库。

对此有任何帮助将不胜感激。我发现的大多数示例都涉及将两个JSON对象组合在一起,但是,整数不会被添加,这是我需要发生的关键部分。

更新

为了更多的背景,这是我正在研究的项目,我不能详细介绍,但是,我可以给出一个伪代码示例。

我正在做的事情背后的基本思想是,我需要结合很多JSON。在这个例子中,我只是将其列为两个,但是在我的代码的最终版本中,它将处理数千个JSON(大数据项目)。它的JSON部分只是我想要完成的一小部分,但却是一个关键部分。

这里是一个关于如何构建其中一个JSON的示例:

{
  "key1": {
    "blue_data": 12,
    "green_data": 0,
    "red_data": [],
    "yellow_Data": [
      "string_1",
      "string_2",
      "string_3"
    ],
    "foo": "XX",
    "bar": "YYY",
    "foobar": "ZZZZ"
  }
}

然而,可以省略一些字段,例如可以包括或不包括最后3个字段,或者它们的子集。

JSON对象传递给我的脚本的方式是数组的形式。因此,数组将包含一系列JSON,我正在使用for循环进行迭代。

for key in list_of_keys:
    for item in json_list:
        json_dump_data = json.loads(item)
        try:
            json_blue_data[key]
        except:
            json_blue_data[key] = int(json_dump_data["blue_data"])
        else:
            json_data_data[key] = json_blue_day[key] + int(json_dump_data["blue_data"])

我正在为每个值执行类似于上面的操作,我基本上会将每个字段分解为dict对象并在最后将它们组合在一起。我知道这不是最有效的方法,但我是新手并使用预先存在的代码。

2 个答案:

答案 0 :(得分:2)

这假设所有键都具有相同的值类型。

它允许深度达到大约1000(默认的Python最大堆栈深度)

import json

obj1 = json.loads('{"key": {"field_string": ["string"],"field_num": 1}}')
obj2 = json.loads('{"key": {"field_string": ["another_string"],"field_num": 2}}')

def combine(obj1, obj2):
    for k, v in obj1.items():
        if k in obj2:
            if isinstance(v, dict):
                combine(obj1[k], obj2[k])
            else:
                # assume list or int based on problem description
                obj1[k] = obj1[k] + obj2[k]


combine(obj1, obj2)
print json.dumps(obj1)

输出:

{"key": {"field_string": ["string", "another_string"], "field_num": 3}}

答案 1 :(得分:1)

将JSON转换为Python对象(字典),执行您需要的操作并再次将Python Object(字典)转换为JSON。使用JSON标准模块。

import json

# input JSON
json1 = '{"key": {"field_string": ["string"],"field_num": 1}}'
json2 = '{"key": {"field_string": ["another_string"],"field_num": 2}}'

# convert JSON to Python dictionary
dict1 = json.loads(json1)
dict2 = json.loads(json2)

# create dictionary for results
dict3 = {'key': {}}

# do what you need
dict3['key']['field_string'] = dict1['key']['field_string'] + dict2['key']['field_string']
dict3['key']['field_num'] = dict1['key']['field_num'] + dict2['key']['field_num']

# convert result to JSON
json3 = json.dumps(dict3)

print(json3)

# {"key": {"field_num": 3, "field_string": ["string", "another_string"]}}