使用Pandas的不同列的替代元素

时间:2017-01-23 14:34:11

标签: python pandas dataframe alternate

我有2个数据帧列,如下所示:

df1 = pd.DataFrame({'A':['CINO','KONO','ROLO','MANE','TUTU']})
df2 = pd.DataFrame({'B':['NION','PONO','RZCO','MPPE','TQAS']})

我的想法是以一种输出如下所示的方式组合数据帧:

        C
CC1  CINO   <---- belongs to A
CC1  NION  <---- belongs to B
CC2  KONO   <---- belongs to A    
CC2  PONO  <---- belongs to B
CC3  ROLO   <---- belongs to A
CC3  RZCO  <---- belongs to B
CC4  MANE   <---- belongs to A
CC4  MPPE  <---- belongs to B
CC5  TUTU   <---- belongs to A
CC5  TQAS  <---- belongs to B

正如您所见,列B的项目位于列A的行之间。 请注意行的命名方式,使每对行具有相同的名称。

你能用一些内置的Pandas功能建议我一个聪明的方法来实现这个目标吗?

2 个答案:

答案 0 :(得分:4)

pd.concat(
    [df1, df2], axis=1
).stack().reset_index(1, drop=True).to_frame('C').rename(index='CC{}'.format)

        C
CC0  CINO
CC0  NION
CC1  KONO
CC1  PONO
CC2  ROLO
CC2  RZCO
CC3  MANE
CC3  MPPE
CC4  TUTU
CC4  TQAS

答案 1 :(得分:2)

您可以使用:

df = pd.concat([df1.rename(columns={'A':'C'}),
                df2.rename(columns={'B':'C'})], keys=[1,2])
       .sort_index(level=[1,0])
       .reset_index(level=0, drop=True)
df.index = 'CC' + df.index.astype(str)
print (df)
        C
CC0  CINO
CC0  NION
CC1  KONO
CC1  PONO
CC2  ROLO
CC2  RZCO
CC3  MANE
CC3  MPPE
CC4  TUTU
CC4  TQAS