python pandas df在multiindex的一部分上合并

时间:2019-08-15 09:24:02

标签: python pandas dataframe merge data-science

我正在将Python 3与熊猫一起使用。

我有两个具有多重索引的数据框,一个人的索引由a,b列组成,另一个人的索引由a,b,c列组成,为此,我们分别调用数据帧ab和abc 。

我想和熊猫一起使用左合并

abc.merge(ab,how =“ left”)并使用索引创建合并。当然,我只需要索引中的a,b,因为c不在ab中,如何在不降低级别和没有reset_index的情况下创建此合并?

首选使用多重索引的简单有效的解决方案。

谢谢

1 个答案:

答案 0 :(得分:0)

使用join可以获得更多的结果,因为它更注重索引。这是我在pd.MultiIndex简介中曾教过的MVE:

first_index = [('A', 'a'), ('A', 'b'), ('B', 'a'), ('B', 'b')]
second_index = [('A', 'a', 'c'), ('A', 'b', 'c'), ('B', 'a', 'c'), ('B', 'b', 'c')]
data = [1, 2, 3, 4]

ab = pd.DataFrame(data=data, index=pd.MultiIndex.from_tuples(first_index, 
                                                             names=['A', 'B']), 
                  columns=['col_1'])
abc = pd.DataFrame(data=data, index=pd.MultiIndex.from_tuples(second_index, 
                                                              names=['A', 'B', 'C']), 
                   columns=['col_2'])
ab
A   B   col_1
A   a   1
A   b   2
B   a   3
B   b   4
abc
A   B   C   col_2
A   a   c   1
A   b   c   2
B   a   c   3
B   b   c   4

因此,到目前为止,这只是带有名称的简单MultiIndex,但对这些名称使用join即可:

abc.join(ab, on=['A', 'B'], how='left')
A   B   C   col_2   col_1
A   a   c   1   1
A   b   c   2   2
B   a   c   3   3
B   b   c   4   4

您获得的left连接没有reset_index