如何使用Pandas将数据框与重复索引值组合在一起

时间:2018-01-02 22:43:44

标签: python-3.x pandas dataframe

我试图将几个数据框组合在一起,每个数据框都有一列。我这样做有问题因为索引包含重复值。例如:

os.utime(path2, (long_ago_posix, long_ago_posix), follow_symlinks = False)

我希望最终的Dataframe看起来像:

In [1]:
import pandas as pd

names = ["AB","AB","CD","CD"]
df1 = pd.DataFrame([1,2,1,2], index = names, columns = ["Series1"])
df1.index.rename("Name", inplace=True)

names = ["AB","AB","CD","CD"]
df2 = pd.DataFrame([3,4,3,4], index = names, columns = ["Series2"])
df2.index.rename("Name", inplace=True)

In[2]:
df1
Out[2]: 
      Series1
Name         
AB          1
AB          2
CD          1
CD          2

In[3]:
df2
Out[3]: 
      Series2
Name         
AB          3
AB          4
CD          3
CD          4

我尝试过使用concat,追加,加入和合并而没有运气 Concat和append给出:

      Series1  Series2
Name         
AB          1        3
AB          2        4
CD          1        3
CD          2        4

虽然合并和加入给出了:

      Series1  Series2
Name                  
AB        1.0      NaN
AB        2.0      NaN
CD        1.0      NaN
CD        2.0      NaN
AB        NaN      3.0
AB        NaN      4.0
CD        NaN      3.0
CD        NaN      4.0

我已经为每个参数尝试了几种不同的参数组合,但总是得到上面的表格或错误。我可以使用什么来正确组合这些表?对我的分析来说,重要的是系列中的数字与正确的名称保持关联。

1 个答案:

答案 0 :(得分:0)

一个简单的concat适用于我:

pd.concat([df1, df2], axis=1)