我有以下数据集:
Col 1 | Col 2 | JSONBlob
0 |A |{"$type":"XYZ, X.Domain","CategoryList":"PC","ListId":"GroceryStore","FactorDescription":"Groceries",
JSONBlob
列是数据框中包含JSON结构化数据的唯一列。
我是Python的新手,但我想将此一列标准化为多列。似乎有些键具有关联的值,即。 "ListID": "GroceryStore"
。
我只是不确定从哪里开始,我在StackOverflow中查看了其他一些类似的问题,但是它们通常处理包含JSON的整个数据帧,而我只有一列。
我正在从excel导入此数据集,因此我可以在excel中将文本转换为列函数以准备数据,但我想提高自己的Python技能
答案 0 :(得分:0)
分别解析JSON,然后加入原始框架:
blobs = []
for index, row in df.iterrows():
b = row['JSONBlob']
blobs.append(pd.json_normalize(b))
blobs = pd.concat(blobs)
df = df.join(blobs)