我有两个数据框,其形状为(707
,140
)和(34
,98
)。
我希望根据相同的索引名称和列名称将较大的数据框架最小化为较小的数据框架。
因此,在从较大的数据框中删除其他行和列之后,在最后它的形状应该是(34
,98
)具有相同的索引和具有小数据帧的列。
我怎么能在python中这样做?
答案 0 :(得分:3)
我认为您可以按loc
index
和columns
小DataFrame
进行选择:
dfbig.loc[dfsmall.index, dfsmall.columns]
样品:
dfbig = pd.DataFrame({'a':[1,2,3,4,5], 'b':[4,7,8,9,4], 'c':[5,0,1,2,4]})
print (dfbig)
a b c
0 1 4 5
1 2 7 0
2 3 8 1
3 4 9 2
4 5 4 4
dfsmall = pd.DataFrame({'a':[4,8], 'c':[0,1]})
print (dfsmall)
a c
0 4 0
1 8 1
print (dfbig.loc[dfsmall.index, dfsmall.columns])
a c
0 1 5
1 2 0