我大约有2000个JSON文件,看起来(大致)如下:
{
"hist": {
"type": "TH2",
"title": "The Title of the Plot",
"stats": {
"name": "The Title of the Plot",
"entries": 720135.0,
},
"xaxis": {
"title": "The X Axis label",
"first": {
"id": 1,
"value": -3
},
"last": {
"id": 31,
"value": 3
}
},
"yaxis": {
"title": "The X Axis label",
"first": {
"id": 1,
"value": -3.14159
},
"last": {
"id": 32,
"value": 3.14159
}
},
"values": {
"min": 0,
"max": 1434
},
"bins": {
"content": [
[
17,
392,
1185
],
[
14,
424,
1083
],
[
8,
392,
1030
],
[
4,
226,
965
]
]
}
}
}
我最感兴趣的是entries
值和content
。实际JSON文件的content
可以是32x31或32x26矩阵。
每个JSON文件都可以通过文件名唯一标识。
我必须对内容进行计算,并且必须能够像这样绘制内容本身:
matplotlib.pyplot.imshow(json_file['hist']['bins']['content'])
由于JSON文件是嵌套的,因此我不确定如何将其存储在pandas
数据框中。我猜想contents
以外的大多数属性都可以展平,但是我不知道如何展平(可变大小)矩阵。
什么是合适的数据格式来存储所有2000个JSON文件?