如何加入这两个pandas数据框?

时间:2013-04-09 06:37:09

标签: python join dataframe pandas

我无法将DataFrame1与DataFrame2连接,我怀疑这是因为其中一个具有int64索引而另一个具有字符串索引。如何将字符串索引转换为int64(如果这确实是问题)?如果没有,我如何合并这两个数据框?

DataFrame1

<class 'pandas.core.frame.DataFrame'>
Int64Index: 9943 entries, 10029934 to 9962359
Data columns:
face_area     9943  non-null values
image_area    9943  non-null values
ratio         9943  non-null values
dtypes: int64(3)

DataFrame2

<class 'pandas.core.frame.DataFrame'>
Index: 9412 entries, 10029934 to 9962359
Data columns:
1        9412  non-null values
2        9412  non-null values
name     9412  non-null values
class    9412  non-null values
dtypes: float64(2), int64(1), object(1)

2 个答案:

答案 0 :(得分:1)

DataFrame2['id'] = DataFrame2.index.map(int)
DataFrame2.set_index('id')

这似乎已经解决了问题,我现在能够加入。如果您有更优雅的解决方案,我仍然喜欢听。

答案 1 :(得分:1)

您可以使用astype

df.index = df.index.astype(int)

示例:

In [1]: df1 = pd.DataFrame([[1, 2], [3, 4]], columns=['a', 'b'])

In [2]: df2 = pd.DataFrame([[1, 2], [3, 4]], columns=['c', 'd'], index=['0','1'])

In [3]: df2.index = df2.index.astype(int)

In [4]: df1.join(df2)
Out[4]: 
   a  b  c  d
0  1  2  1  2
1  3  4  3  4