遍历df并输出带有值列表的字典

时间:2019-04-15 16:00:55

标签: python pandas dictionary

我需要将数据框转换为字典,但无法从该数据框获取所有值以出现在字典中。

数据框:

id| region | Num | 
--|--------|-----|
2 | NYC    |2344 |
3 | NYC    |3243 |
4 | NYC    |3253 |
5 | NYC    |2345 |
6 | CHI    |8756 |
7 | CHI    |9786 |
8 | CHI    |7674 |
9 | CHI    |6678 |
10| ATL    |1234 |

代码:

df.set_index('region').T.to_dict('list')

我需要的是

{'NYC: [2344, 3243, 3253, 2345 ], 'CHI': [8756, 9786, 7674, 6678], 'ATL': [1234] }

但是我得到的是:

{'NYC: [2345 ], 'CHI': [6678], 'ATL': [1234] }

我尝试过:

    num_dict = {}
    for region, num in df:
        num_dict.setdefault(region, []).append(num)

但这给了我(ValueError: too many values to unpack (expected 2)

有更好的方法吗?

谢谢!

1 个答案:

答案 0 :(得分:5)

依次使用groupby.apply(list).to_dict

df.groupby('region')['Num'].apply(list).to_dict()

[出]

{'ATL': [1234],
 'CHI': [8756, 9786, 7674, 6678],
 'NYC': [2344, 3243, 3253, 2345]}