Question

我在将json文件读取到熊猫数据帧时遇到问题。我有一个像这样的大型json文件：

`{"name":
         [{"header": -999.0,
           "header2": -999.0,
           "header3": -999.0,
            .....
           "headern": -999.0},
            .....
            .....

           {"header": -999.0,
           "header2": -999.0,
           "header3": -999.0}],
 "name2":
           [{"header": -999.0,
           "header2": -999.0,
           "header3": -999.0,
            .....
           "headern": -999.0},
            .....
            .....

           {"header": -999.0,
           "header2": -999.0,
           "header3": -999.0,]}

按预期data = pd.read_json(source,orient='index',lines=True)读取文件，以便“名称”是索引，并且标题和值是每行的一列。我希望表格采用以下形式：

    header1 header2 ... header n
 0   -999   -999          -999
 1   -999   -999          -999
 2   -999   -999          -999

我试图用这样的代码（以及许多其他代码）遍历文件

for index, row in data.iterrows():             
    df.append(pd.DataFrame.from_dict(row),ignore_index=True)

但是我无法获得正确的结构（例如，上面的示例给出了空的df）。我是python＆pandas的新手，所以我可能对数据帧没有足够的了解，但是在多次阅读文档后，我仍然无法弄清这一点。

来自JSON转换问题的Python Pandas数据框

0 个答案: