我试图将几个数据框组合在一起,每个数据框都有一列。我这样做有问题因为索引包含重复值。例如:
os.utime(path2, (long_ago_posix, long_ago_posix), follow_symlinks = False)
我希望最终的Dataframe看起来像:
In [1]:
import pandas as pd
names = ["AB","AB","CD","CD"]
df1 = pd.DataFrame([1,2,1,2], index = names, columns = ["Series1"])
df1.index.rename("Name", inplace=True)
names = ["AB","AB","CD","CD"]
df2 = pd.DataFrame([3,4,3,4], index = names, columns = ["Series2"])
df2.index.rename("Name", inplace=True)
In[2]:
df1
Out[2]:
Series1
Name
AB 1
AB 2
CD 1
CD 2
In[3]:
df2
Out[3]:
Series2
Name
AB 3
AB 4
CD 3
CD 4
我尝试过使用concat,追加,加入和合并而没有运气 Concat和append给出:
Series1 Series2
Name
AB 1 3
AB 2 4
CD 1 3
CD 2 4
虽然合并和加入给出了:
Series1 Series2
Name
AB 1.0 NaN
AB 2.0 NaN
CD 1.0 NaN
CD 2.0 NaN
AB NaN 3.0
AB NaN 4.0
CD NaN 3.0
CD NaN 4.0
我已经为每个参数尝试了几种不同的参数组合,但总是得到上面的表格或错误。我可以使用什么来正确组合这些表?对我的分析来说,重要的是系列中的数字与正确的名称保持关联。
答案 0 :(得分:0)
一个简单的concat
适用于我:
pd.concat([df1, df2], axis=1)