用于存储多个嵌套JSON文件的数据格式

时间:2019-01-16 10:43:39

标签: python json pandas numpy matplotlib

我大约有2000个JSON文件,看起来(大致)如下:

{
  "hist": {
    "type": "TH2",
    "title": "The Title of the Plot",
    "stats": {
      "name": "The Title of the Plot",
      "entries": 720135.0,
    },
    "xaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3
      },
      "last": {
        "id": 31,
        "value": 3
      }
    },
    "yaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3.14159
      },
      "last": {
        "id": 32,
        "value": 3.14159
      }
    },
    "values": {
      "min": 0,
      "max": 1434
    },
    "bins": {
      "content": [
        [
          17,
          392,
          1185
        ],
        [
          14,
          424,
          1083
        ],
        [
          8,
          392,
          1030
        ],
        [
          4,
          226,
          965
        ]
      ]
    }
  }
}

我最感兴趣的是entries值和content。实际JSON文件的content可以是32x31或32x26矩阵。

每个JSON文件都可以通过文件名唯一标识。

我必须对内容进行计算,并且必须能够像这样绘制内容本身:

matplotlib.pyplot.imshow(json_file['hist']['bins']['content'])

由于JSON文件是嵌套的,因此我不确定如何将其存储在pandas数据框中。我猜想contents以外的大多数属性都可以展平,但是我不知道如何展平(可变大小)矩阵。

什么是合适的数据格式来存储所有2000个JSON文件?

0 个答案:

没有答案