我有一个json行文件,其中每行都有一些我试图(大部分)变平的结构,因此:
with open("/home/igor/data/feed.jsonl") as json_file:
thelist2 = []
for line in json_file:
thelist2.append(json_normalize(json.loads(line)))
后跟pd.concat(thelist2)
上面的语义是正确的,但不太好的是,这是非常慢的,而在没有json_normalize
的情况下运行上面的速度非常快(但是错误的是)。有没有办法在事后或其他一些更快的方案中规范化数据帧?