我需要将数据框转换为字典,但无法从该数据框获取所有值以出现在字典中。
数据框:
id| region | Num |
--|--------|-----|
2 | NYC |2344 |
3 | NYC |3243 |
4 | NYC |3253 |
5 | NYC |2345 |
6 | CHI |8756 |
7 | CHI |9786 |
8 | CHI |7674 |
9 | CHI |6678 |
10| ATL |1234 |
代码:
df.set_index('region').T.to_dict('list')
:
我需要的是
{'NYC: [2344, 3243, 3253, 2345 ], 'CHI': [8756, 9786, 7674, 6678], 'ATL': [1234] }
但是我得到的是:
{'NYC: [2345 ], 'CHI': [6678], 'ATL': [1234] }
我尝试过:
num_dict = {}
for region, num in df:
num_dict.setdefault(region, []).append(num)
但这给了我(ValueError: too many values to unpack (expected 2)
。
有更好的方法吗?
谢谢!
答案 0 :(得分:5)
依次使用groupby.apply(list)
和.to_dict
df.groupby('region')['Num'].apply(list).to_dict()
[出]
{'ATL': [1234],
'CHI': [8756, 9786, 7674, 6678],
'NYC': [2344, 3243, 3253, 2345]}