将熊猫数据框转换为嵌套JSON

时间:2019-10-18 03:32:06

标签: python json pandas

我有一个带有39个变量的大熊猫数据框。我需要将其转换为JSON格式,使其具有3个键。例如。

{"Key1":"Var1","Key2":{"Var2":"25","Var3":"10","Var4":"5","Var5":"2"},"Key3":{"Var6":"1","Var7":"0","Var8":"10"}}

还需要将与变量关联的值作为字符串

任何帮助将不胜感激!

1 个答案:

答案 0 :(得分:0)

我不知道您的数据框有多大,但是您可以对其进行迭代,处理每一行并将其保存到JSON文件中。让我向您展示以下示例。

首先,我将导入软件包并创建示例数据集:

import pandas as pd
import json

df = pd.DataFrame(
    [
        {'Var1': 23, 'Var2': 25, 'Var3': 10, 'Var4': 5, 'Var5': 2, 'Var6': 1, 'Var7': 0, 'Var8': 10},
        {'Var1': 24, 'Var2': 26, 'Var3': 11, 'Var4': 6, 'Var5': 3, 'Var6': 2, 'Var7': 1, 'Var8': 11},
        {'Var1': 25, 'Var2': 27, 'Var3': 12, 'Var4': 7, 'Var5': 4, 'Var6': 3, 'Var7': 2, 'Var8': 12},
        {'Var1': 26, 'Var2': 28, 'Var3': 13, 'Var4': 8, 'Var5': 5, 'Var6': 4, 'Var7': 3, 'Var8': 13},
    ]
)

print(df)

代码产生以下输出:

   Var1  Var2  Var3  Var4  Var5  Var6  Var7  Var8
0    23    25    10     5     2     1     0    10
1    24    26    11     6     3     2     1    11
2    25    27    12     7     4     3     2    12
3    26    28    13     8     5     4     3    13

现在,我将向您展示代码的主要部分:

with open('test_json_file.json', 'w') as file:
    for i, row in df.iterrows():
        json_to_save = {
            "Key1": str(row.Var1),
            "Key2": {
                "Var2": str(row.Var2),
                "Var3": str(row.Var3),
                "Var4": str(row.Var4),
                "Var5": str(row.Var5)
            },
            "Key3": {
                "Var6": str(row.Var6),
                "Var7": str(row.Var7),
                "Var8": str(row.Var8)
            }
        }
        file.write(json.dumps(json_to_save) + '\n')

代码创建test_json_file.json文件,并将在for循环中定义的json_to_save json保存在文件中的新行上,例如G。在文件的第一行,您将找到以下json:{"Key1": "23", "Key2": {"Var2": "25", "Var3": "10", "Var4": "5", "Var5": "2"}, "Key3": {"Var6": "1", "Var7": "0", "Var8": "10"}}

我希望它会有所帮助。