这是将JSON数据集加载到Pandas DataFrames中的最有效方法

时间:2013-05-08 15:41:08

标签: python json dataframe pandas

我没有在JSON上的Pandas文档和食谱中找到任何内容(只是引用了CSV和带有分隔符的文本文件)。

是否已经定义了将JSON直接加载到DataFrame中的函数?如果有不同的选择,哪个最有效?

3 个答案:

答案 0 :(得分:11)

pandas 0.12:

import pandas as pd

d = pd.read_json('JSON File')

答案 1 :(得分:9)

上面提到了将JSON添加到DataFrame的一般方法:

import pandas as pd
d = pd.read_json('JSON File')

但是,如果您的JSON文件是嵌套的,并且您需要在其中创建一些嵌套属性的DataFrame,则可以使用

 from pandas.io.json import json_normalize
 json_normalize(df[JSONKEYWORD])

在JSONKEYWORD中,可以传递嵌套的JSON对象,并获得该嵌套JSON对象的子数据框。

答案 2 :(得分:0)

从github安装pandasjson,它提供Data_rame from_json和to_json classmethods。

https://github.com/pydata/pandasjson

import pandasjson
from pandas import DataFrame

"""
pinfo DataFrame.from_json
File:  ../lib/python2.7/site-packages/pandasjson.py
Definition: DataFrame.from_json(cls, json, orient='columns', dtype=None, numpy=True)

pinfo DataFrame.to_json
File:  ../lib/python2.7/site-packages/pandasjson.py
Definition: DataFrame.to_json(self, orient='columns', double_precision=10, force_ascii=True)
"""