如何将JSON文件加载到Pandas数据帧中,具体错误

时间:2017-03-23 17:00:56

标签: python json dataframe

我有一个作业,我正在尝试将nutrient.json文件加载到pandas数据框中。我使用的是python 3.5 我试过两种方法

  1. data_df = pd.read_json(" nutrients.json&#34)

  2. 这会产生错误" ValueError:尾随数据"

    2。     #将整个文件读入python数组     打开(' nutrient.json',' rb')作为f:         data = f.readlines()

    # remove the trailing "\n" from each line
    data = map(lambda x: x.rstrip(), data)
    data = map(str, data)
    # each element of 'data' is an individual JSON object.
    # i want to convert it into an *array* of JSON objects
    # which, in and of itself, is one large JSON object
    # basically... add square brackets to the beginning
    # and end, and have all the individual business JSON objects
    # separated by a comma
    data_json_str = "[" + ','.join(data) + "]"
    
    # now, load it into pandas
    data_df = pd.read_json(data_json_str)
    

    这会产生错误

    ValueError:预期的对象或值

    nutrient.json是我使用下面的说明提取的文件。它是一个335 Mb的文件。请你帮我一下。

    非常感谢你

    1. https://github.com/schirinos/nutrient-db.git

      查看来自GitHub的营养-db python实用程序
      1. 使用python nutrientdb.py -e>运行主程序nutrient.json将USDA数据转换为JSON格式。有关详细信息,请查看https://github.com/schirinos/nutrient-db。您可能必须通过pip install pymongo
      2. 为MongoDB接口安装python实用程序

1 个答案:

答案 0 :(得分:0)

通过jsonlint.com运行您的文件,以查看您的文件是否针对json正确格式化。

您的第一次尝试写得正确:

df= pd.read_json('example_json.json')