从tar.gz文件夹中读取json文件并转换为pandas数据框

时间:2019-07-14 19:57:48

标签: pandas

我从未使用过json文件,我的问题是我有几个文件夹 tar.gz包含不同的json文件。从每个压缩的文件夹中,我只需要读取AA json文件,将其追加并转换为pandas数据框。我以这种方式尝试过

import os, re
import pandas as pd

import pandas as pd 
import tarfile
import json
from pandas.io.json import json_normalize

cd = "my_path"

dfList = []

for root, dirs, files in os.walk(cd):
 with tarfile.open("dirs", "r:*") as tar:
    for fname in files:
        if re.match("AA_*.json$", fname):
            data = json.load(fname)
            frame = pd.DataFrame.from_dict(json_normilized(data), 
orient='columns')
            dfList.append(frame)    

 df = pd.concat(dfList) 

我发现了错误

FileNotFoundError:[错误2]没有这样的文件或目录:'dirs'

1 个答案:

答案 0 :(得分:0)

import pandas as pd
data = pd.read_json('filepath/filename')
data