将Pandas数据帧减少到其他数据帧

时间:2016-09-18 15:53:41

标签: python pandas dataframe multiple-columns

我有两个数据框,其形状为(707140)和(3498)。

我希望根据相同的索引名称和列名称将较大的数据框架最小化为较小的数据框架。

因此,在从较大的数据框中删除其他行和列之后,在最后它的形状应该是(3498)具有相同的索引和具有小数据帧的列。

我怎么能在python中这样做?

1 个答案:

答案 0 :(得分:3)

我认为您可以按loc indexcolumnsDataFrame进行选择:

dfbig.loc[dfsmall.index, dfsmall.columns]

样品:

dfbig = pd.DataFrame({'a':[1,2,3,4,5], 'b':[4,7,8,9,4], 'c':[5,0,1,2,4]})
print (dfbig)
   a  b  c
0  1  4  5
1  2  7  0
2  3  8  1
3  4  9  2
4  5  4  4

dfsmall = pd.DataFrame({'a':[4,8], 'c':[0,1]})
print (dfsmall)
   a  c
0  4  0
1  8  1

print (dfbig.loc[dfsmall.index, dfsmall.columns])
   a  c
0  1  5
1  2  0