python3:从Json文件中提取相同的类型值

时间:2016-12-06 11:29:43

标签: json python-3.x extract-value

以下是我的Json文件,它在base64上解码。

response={"response": [{"objcontent": [{"title": "Pressure","rowkeys": [
                    "lat",
                    "lon",
                    "Pressure"
                ],
                "rowvalues": [
                    [
                        "WxsArK0NV0A=",
                        "uaQCWFxSM0A=",
                        "ncvggc7lcUA6MVVLnZiMQH6msaA+0yhANzLp2RsZhkBwobfXt9BXQKtxbnjV+IFARq3fVqOWiEBwyyvmt+V9QDGg7k8YUHpA4IZm9W/De0A="
                    ],
                    [
                        "WxsArK0NV0A=",
                        "HqJT4w7RUkA=",
                        "BfPox4I5ikCLVYxUxWqIQIFwlJFA+IVAJeQ6gBLyhEBB0QlkoGiCQDOkvnAZUm1AkGbWKEgza0A+FCkwH4phQHwSRSY+iVRAKcvC4pRliEA="
                    ],
                    [
                        "WxsArK0NV0A=",
                        "G5rYdw0NXkA=",
                        "C9dhhIVrg0B2hCvzOoKKQMrMWhll5o5AIujgxBB0ZkD8+EipfXx0QOXh0LLycH5ATdtxKqbtdkAw66X3l/VhQLqvZBbd13FAjKl2+8UUjUA="
                    ],
                    [
                        "WxsArK0NV0A=",
                        "PTvsm55daEA=",
                        "W+wyHC12dUCrvSLM1d6BQMfay0ZjbYpAjnk4Ecc8dkDH35pL429xQPTOwkF6Z41Aci5JATkXjUBQ6Wjlp3RQQFlpNGmsNHpAFf0DUor+dUA="
                    ]]}]}]}

我解码了值并使用这些值绘制了一个图。以下是代码。

import base64
import struct
import numpy as np
import pylab as pl
for response_i in response['response']:
    for row in response_i['objcontent'][0]['rowvalues']:
        for item in row[:]:
            decoded=base64.b64decode(item)
            if len(decoded)<9:
                a=struct.unpack('d',decoded)

            else:
                decoded=base64.b64decode(item)
                a=struct.unpack('10d',decoded)
            last=np.array(a)
            pl.show(pl.plot(last))

但我想重新调整每个列表的价值。在'行键'中有3个元素[ "lat", "lon", "Pressure"]因此每个rowvalues列表中有3个值。

我的问题是如何将rowvalues中的不同值分开,并将其添加到rowkeys的每个组中。 所以,最后我想有3个包含所有解码值的列表。

'lat': [WxsArK0NV0A=,WxsArK0NV0A=,WxsArK0NV0A=,WxsArK0NV0A=]

'lon': [uaQCWFxSM0A=,HqJT4w7RUkA=,G5rYdw0NXkA=,PTvsm55daEA=]

'pressure': [ncvggc7lcUA6MVVLnZiMQH6msaA+0yhANzLp2RsZhkBwobfXt9BXQKtxbnjV+IFARq3fVqOWiEBwyyvmt+V9QDGg7k8YUHpA4IZm9W/De0A=, BfPox4I5ikCLVYxUxWqIQIFwlJFA+IVAJeQ6gBLyhEBB0QlkoGiCQDOkvnAZUm1AkGbWKEgza0A+FCkwH4phQHwSRSY+iVRAKcvC4pRliEA=, C9dhhIVrg0B2hCvzOoKKQMrMWhll5o5AIujgxBB0ZkD8+EipfXx0QOXh0LLycH5ATdtxKqbtdkAw66X3l/VhQLqvZBbd13FAjKl2+8UUjUA=, W+wyHC12dUCrvSLM1d6BQMfay0ZjbYpAjnk4Ecc8dkDH35pL429xQPTOwkF6Z41Aci5JATkXjUBQ6Wjlp3RQQFlpNGmsNHpAFf0DUor+dUA=] 

1 个答案:

答案 0 :(得分:0)

一种方法是手动对数据进行排序,如下所示:

from collections import defaultdict
from base64 import b64decode
import json

d = defaultdict(list)

js = ''
with open(json_file) as f:
    js = b64decode(f.read()).decode()
js = json.loads(js)

response = js['response']['obj_content'][0] 
for i, col_name in enumerate(response['row_keys']):
    for row_val in ['row_values']:
        d[col_name].append(row_val[i])

defaultdict会在调用以前不存在的密钥时自动创建新的list,这会使您的代码更加流畅。

另一种选择是使用pandas.DataFrame并加载如下数据:

import pandas as pd
response = json_file['response']['obj_content'][0]
df = pd.DataFrame(response['row_values'], columns= response['row_keys'])

关于pandas的巧妙之处在于,它的功能非常广泛;例如,您可以使用之前创建的DataFrame来绘制数据,如下所示:

df.plot()