我有一个导入pandas的json文件。第一列填充了json格式的单元格。下面是10K细胞的第一个细胞......
df = pd.read_json("test_file.json") # import data
print (df['test_column'].iloc[0]) # print first cell
{'data': [{'time': '2016-03-25', 'id': '54', 'stop': {'length': 38, 'fun_time': False, 'before': '2015-03-24', 'id': '10xd9'}}], 'dataType': 'life', 'weird': '2013-06-15', '_id': 'dirt', '_type': 'what', 'trace': '32', 'timestamp': 1418193255, 'teller': 'jeff', 'work': '1', 'eventCategory': 'so_true', 'eventType': 'complete', 'city': 'CHI', 'type': 'some_type', 'value': '32', 'data': 'river' }}}
上面的代码是每个单元格中实际数据的近似值
是否有一种快速方法可以提取json数据中的所有键值,将它们作为标题附加到pandas中的新列,然后将值添加到相应的行?
由于
答案 0 :(得分:1)
尝试
pd.io.json.json_normalize(df.test_column.apply(pd.io.json.loads))