从pandas数据框创建字典

时间:2019-12-21 10:04:00

标签: python pandas dictionary

我有以下代码

pd.DataFrame(index=["A", "A", "B","B","B"], columns=["col1","col2","col3"],
data=np.array([[5,3,5],[8,6,4],[8,6,4],[2,7,6],[8,6,4]]))

这将导致以下数据框

    col1    col2    col3
A      5     3       5
A      8     6       4
B      8     6       4
B      2     7       6
B      8     6       4

我想用键A和B并用值将其作为其余数据的数据帧来创建字典。例如,对于A,该值应为如下所示的数据框。

col1    col2    col3
5        3       5
8        6       4

1 个答案:

答案 0 :(得分:2)

将字典理解与groupbyDataFrame.reset_index一起用作默认索引:

d = {k:v.reset_index(drop=True) for k, v in df.groupby(level=0)}
print (d)
{'A':    col1  col2  col3
0     5     3     5
1     8     6     4, 'B':    col1  col2  col3
0     8     6     4
1     2     7     6
2     8     6     4}

print (d['A'])
   col1  col2  col3
0     5     3     5
1     8     6     4

如果有必要更改索引值,则可以使用:

d = dict(tuple(df.groupby(level=0)))
print (d['A'])
   col1  col2  col3
A     5     3     5
A     8     6     4

但是,就像使用DataFrame.loc选择原始数据一样:

print (df.loc['A'])
   col1  col2  col3
A     5     3     5
A     8     6     4

设置

df = pd.DataFrame(index=["A", "A", "B","B","B"], 
                  columns=["col1","col2","col3"],
                  data=np.array([[5,3,5],[8,6,4],[8,6,4],[2,7,6],[8,6,4]]))