我有一个数据框df
id price date zipcode
u734 8923944 2017-01-05 AERIU87
uh72 9084582 2017-07-28 BJDHEU3
u029 299433 2017-09-31 038ZJKE
我想创建一个具有以下结构的字典
{'id': xxx, 'data': {'price': xxx, 'date': xxx, 'zipcode': xxx}}
到目前为止我做了什么
ids = df['id']
prices = df['price']
dates = df['date']
zips = df['zipcode']
d = {'id':idx, 'data':{'price':p, 'date':d, 'zipcode':z} for idx,p,d,z in zip(ids,prices,dates,zips)}
>>> SyntaxError: invalid syntax
但是我得到了上面的错误。
使用
执行此操作的正确方法是什么?OR
奖励积分:算法的复杂程度是多少,是否有更有效的方法可以做到这一点?
答案 0 :(得分:4)
我建议列表理解。
v = df.pop('id')
data = [
{'id' : i, 'data' : j}
for i, j in zip(v, df.to_dict(orient='records'))
]
或紧凑版,
data = [dict(id=i, data=j) for i, j in zip(df.pop('id'), df.to_dict(orient='r'))]
请注意,如果您在表达式中弹出id
,则 将成为zip
的第一个参数。
print(data)
[{'data': {'date': '2017-09-31',
'price': 299433,
'zipcode': '038ZJKE'},
'id': 'u029'},
{'data': {'date': '2017-01-05',
'price': 8923944,
'zipcode': 'AERIU87'},
'id': 'u734'},
{'data': {'date': '2017-07-28',
'price': 9084582,
'zipcode': 'BJDHEU3'},
'id': 'uh72'}]