我在将json文件读取到熊猫数据帧时遇到问题。我有一个像这样的大型json文件:
`{"name":
[{"header": -999.0,
"header2": -999.0,
"header3": -999.0,
.....
"headern": -999.0},
.....
.....
{"header": -999.0,
"header2": -999.0,
"header3": -999.0}],
"name2":
[{"header": -999.0,
"header2": -999.0,
"header3": -999.0,
.....
"headern": -999.0},
.....
.....
{"header": -999.0,
"header2": -999.0,
"header3": -999.0,]}
按预期data = pd.read_json(source,orient='index',lines=True)
读取文件,以便“名称”是索引,并且标题和值是每行的一列。我希望表格采用以下形式:
header1 header2 ... header n
0 -999 -999 -999
1 -999 -999 -999
2 -999 -999 -999
我试图用这样的代码(以及许多其他代码)遍历文件
for index, row in data.iterrows():
df.append(pd.DataFrame.from_dict(row),ignore_index=True)
但是我无法获得正确的结构(例如,上面的示例给出了空的df)。我是python&pandas的新手,所以我可能对数据帧没有足够的了解,但是在多次阅读文档后,我仍然无法弄清这一点。