我正在将Python 3与熊猫一起使用。
我有两个具有多重索引的数据框,一个人的索引由a,b列组成,另一个人的索引由a,b,c列组成,为此,我们分别调用数据帧ab和abc 。
我想和熊猫一起使用左合并
abc.merge(ab,how =“ left”)并使用索引创建合并。当然,我只需要索引中的a,b,因为c不在ab中,如何在不降低级别和没有reset_index的情况下创建此合并?
首选使用多重索引的简单有效的解决方案。
谢谢
答案 0 :(得分:0)
使用join
可以获得更多的结果,因为它更注重索引。这是我在pd.MultiIndex
简介中曾教过的MVE:
first_index = [('A', 'a'), ('A', 'b'), ('B', 'a'), ('B', 'b')]
second_index = [('A', 'a', 'c'), ('A', 'b', 'c'), ('B', 'a', 'c'), ('B', 'b', 'c')]
data = [1, 2, 3, 4]
ab = pd.DataFrame(data=data, index=pd.MultiIndex.from_tuples(first_index,
names=['A', 'B']),
columns=['col_1'])
abc = pd.DataFrame(data=data, index=pd.MultiIndex.from_tuples(second_index,
names=['A', 'B', 'C']),
columns=['col_2'])
ab
A B col_1
A a 1
A b 2
B a 3
B b 4
abc
A B C col_2
A a c 1
A b c 2
B a c 3
B b c 4
因此,到目前为止,这只是带有名称的简单MultiIndex,但对这些名称使用join即可:
abc.join(ab, on=['A', 'B'], how='left')
A B C col_2 col_1
A a c 1 1
A b c 2 2
B a c 3 3
B b c 4 4
您获得的left
连接没有reset_index
。