我有一个非常大的JSON文件列表,其格式为TextEdit文档,每个文档都有6个键值对。
我想将每个键值对转换为Pandas Dataframe的列名,并列出列下的值。
{'column1': "stuff stuff", 'column2': "details details, ....}
有没有一种标准方法可以做到这一点?
我认为您可以开始使用
将文件上传到数据框中import pandas as pd
df = pd.read_table(file_name)
我认为可以通过使用groupby遍历每个JSON文档来创建每个列。
编辑:我认为正确的方法是将每个JSON对象解析为Dataframe,然后创建一个函数来迭代所有JSON并创建一个Dataframe。
答案 0 :(得分:0)
查看read_json或json_normalize。您确实很可能会阅读每个文件,然后使用例如pd.concat根据需要组合它们。
以下行中的某些内容应该有效,具体取决于文件的外观(此处假设每个json
dictionary
在文件中构成一行:
df = pd.DataFrame()
f = open('workfile', 'r')
for line in f:
df = pd.concat([df, pd.read_json(line, orient='columns')])