将数据帧转换为子列表或词典

时间:2016-10-24 13:05:34

标签: python pandas

我有表格格式(行和列)的数据,我将其读入数据框(Data1):

     Name         D    Score
0   Angelica     D1     3.5
1   Angelica     D2     2.0
2   Bill         D1     2.0
3   Chan         D3     1.0 
......

我可以使用以下方法将其转换为列表:

Data2 = Data1.values.tolist()

并获得以下输出:

[
['Angelica', 'D1', 3.5], ['Angelica', 'D2', 2.0],
['Bill', 'D1', 2.0], ['Bill', 'D2', 3.5],
['Chan', 'D8', 1.0], ['Chan', 'D3', 3.0], ['Chan', 'D4', 5.0],
['Dan', 'D4', 3.0], ['Dan', 'D5', 4.5], ['Dan', 'D6', 4.0]
]

我想要的是,输出是这样的:

{
'Angelica': {'D1': 3.5, 'D2': 2.0} ,
'Bill': {'D1': 2.0, 'D2': 3.5} 
'Chan': {'D8': 1.0, 'D3': 3.0, 'D4': 5.0 } 
'Dan': {'D4': 3.0, 'D5': 4.5, 'D6': 4.0} 
}

我如何在Python中实现这一目标?

3 个答案:

答案 0 :(得分:2)

您可以在Name分组 df之后使用词典理解

>>> df = pd.DataFrame([{'Name': 'Angela', 'Score': 3.5, 'D': 'D1'}, {'Name': 'Angela', 'Score': 2.0, 'D': 'D2'}, {'Name': 'Bill', 'Score': 2.0, 'D': 'D1'}, {'Name': 'Chan', 'Score': 1.0, 'D': 'D3'}])
>>> df
    D    Name  Score
0  D1  Angela    3.5
1  D2  Angela    2.0
2  D1    Bill    2.0
3  D3    Chan    1.0
>>> data2 = {name: {df.ix[v].D: df.ix[v].Score for v in val} for name, val in df.groupby('Name').groups.items()}
>>> data2
{'Chan': {'D3': 1.0}, 'Angela': {'D1': 3.5, 'D2': 2.0}, 'Bill': {'D1': 2.0}}

答案 1 :(得分:2)

按名称分组后,您可以压缩每组中的值:

In [4]: l = [
   ...: ['Angelica', 'D1', 3.5], ['Angelica', 'D2', 2.0],
   ...: ['Bill', 'D1', 2.0], ['Bill', 'D2', 3.5],
   ...: ['Chan', 'D8', 1.0], ['Chan', 'D3', 3.0], ['Chan', 'D4', 5.0],
   ...: ['Dan', 'D4', 3.0], ['Dan', 'D5', 4.5], ['Dan', 'D6', 4.0]
   ...: ]
   ...: columns=["Name", "D", "Score"]
   ...: df = pd.DataFrame(l, columns=columns)
   ...: 

In [5]: {name: dict(zip(v["D"], v["Score"])) for name, v in df.groupby("Name")}


In [6]: data
Out[6]: 
{'Angelica': {'D1': 3.5, 'D2': 2.0},
 'Bill': {'D1': 2.0, 'D2': 3.5},
 'Chan': {'D3': 3.0, 'D4': 5.0, 'D8': 1.0},
 'Dan': {'D4': 3.0, 'D5': 4.5, 'D6': 4.0}}

答案 2 :(得分:0)

from collections import defaultdict
result = defaultdict(dict)

for item in Data2:
    result[item[0]].update(dict([item[1:]]))