我有以下代码
pd.DataFrame(index=["A", "A", "B","B","B"], columns=["col1","col2","col3"],
data=np.array([[5,3,5],[8,6,4],[8,6,4],[2,7,6],[8,6,4]]))
这将导致以下数据框
col1 col2 col3
A 5 3 5
A 8 6 4
B 8 6 4
B 2 7 6
B 8 6 4
我想用键A和B并用值将其作为其余数据的数据帧来创建字典。例如,对于A,该值应为如下所示的数据框。
col1 col2 col3
5 3 5
8 6 4
答案 0 :(得分:2)
将字典理解与groupby
和DataFrame.reset_index
一起用作默认索引:
d = {k:v.reset_index(drop=True) for k, v in df.groupby(level=0)}
print (d)
{'A': col1 col2 col3
0 5 3 5
1 8 6 4, 'B': col1 col2 col3
0 8 6 4
1 2 7 6
2 8 6 4}
print (d['A'])
col1 col2 col3
0 5 3 5
1 8 6 4
如果有必要更改索引值,则可以使用:
d = dict(tuple(df.groupby(level=0)))
print (d['A'])
col1 col2 col3
A 5 3 5
A 8 6 4
但是,就像使用DataFrame.loc
选择原始数据一样:
print (df.loc['A'])
col1 col2 col3
A 5 3 5
A 8 6 4
设置:
df = pd.DataFrame(index=["A", "A", "B","B","B"],
columns=["col1","col2","col3"],
data=np.array([[5,3,5],[8,6,4],[8,6,4],[2,7,6],[8,6,4]]))