标准化包含JSON的数据框列

时间:2020-08-19 18:35:51

标签: json pandas

我有以下数据集:

Col 1 | Col 2 | JSONBlob                                        
0     |A      |{"$type":"XYZ, X.Domain","CategoryList":"PC","ListId":"GroceryStore","FactorDescription":"Groceries",

JSONBlob列是数据框中包含JSON结构化数据的唯一列。

我是Python的新手,但我想将此一列标准化为多列。似乎有些键具有关联的值,即。 "ListID": "GroceryStore"

我只是不确定从哪里开始,我在StackOverflow中查看了其他一些类似的问题,但是它们通常处理包含JSON的整个数据帧,而我只有一列。

我正在从excel导入此数据集,因此我可以在excel中将文本转换为列函数以准备数据,但我想提高自己的Python技能

1 个答案:

答案 0 :(得分:0)

分别解析JSON,然后加入原始框架:

blobs = []
for index, row in df.iterrows():
    b = row['JSONBlob']
    blobs.append(pd.json_normalize(b))

blobs = pd.concat(blobs)
df = df.join(blobs)