我正在尝试将数据框转换为字典,并使用列(col 3)中的唯一值作为键。
从此:
Col1 Col2 Col3
0 a b x
1 c d x
2 e f y
3 g h y
对此:
{x:[[a,b][c,d]],y:[[e,f],[g,h]]}
使用以下代码,我得到了元组,但实际上并不能解决我的问题。
new_dict = df.groupby('col3').apply(lambda x: list(zip(x['col1'],x['col2']))).to_dict()
输出:
{x:[(a,b),(c,d)],y:[(e,f),(g,h)]}
答案 0 :(得分:2)
使用map
列出或列出理解:
new_dict = (df.groupby('col3')
.apply(lambda x: list(map(list, zip(x['col1'],x['col2']))))
.to_dict())
print (new_dict)
{'x': [['a', 'b'], ['c', 'd']], 'y': [['e', 'f'], ['g', 'h']]}
new_dict = (df.groupby('col3')
.apply(lambda x: [list(y) for y in zip(x['col1'],x['col2'])])
.to_dict())
另一种解决方案是将每个组转换为2d数组并转换为list
:
new_dict = df.groupby('col3')['col1','col2'].apply(lambda x: x.values.tolist()).to_dict()