Question

我有两个数据框：

df1 = pd.DataFrame(data={
  'ColumnA': ['A1','A2','A3'],
  'ColumnB' : [ 'B1','B2','B3'],
  'ColumnC' : [ 'C1','C2','C3']
})


df2 = pd.DataFrame(data={
  'id': ['1'],
  'Value1' : [ 'v1'],
  'Value2' : [ 'v2']
})



  ColumnB ColumnC columnA id
0      B1      C1      A1  1
1      B2      C2      A2  1
2      B3      C3      A3  1


  Value1 Value2 id
0     v1     v2  1

并希望获得df3，其中df1上的所有行都将包含来自df2的列。

  ColumnB ColumnC columnA id Value1 Value2
0      B1      C1      A1  1     v1     v2
1      B2      C2      A2  1     v1     v2
2      B3      C3      A3  1     v1     v2

目前我这样做：

id = df2['id'][0]
df1['id'] = id

df3 = df1.merge(df2,left_on='id',right_on='id',how='left')

最好的办法是什么？

Answer 1

按Series所选第一行创建的df2使用assign：

df3 = df1.assign(**df2.iloc[0])
print (df3)
  ColumnA ColumnB ColumnC Value1 Value2 id
0      A1      B1      C1     v1     v2  1
1      A2      B2      C2     v1     v2  1
2      A3      B3      C3     v1     v2  1

Answer 2

将pd.concat与ffill()

一起使用

pd.concat([df1,df2],axis=1).ffill()
Out[388]: 
  ColumnA ColumnB ColumnC Value1 Value2 id
0      A1      B1      C1     v1     v2  1
1      A2      B2      C2     v1     v2  1
2      A3      B3      C3     v1     v2  1

Answer 3

另一种方式

In [1728]: df1.assign(k=0).merge(df2.assign(k=0), on='k').drop('k', 1)
Out[1728]:
  ColumnA ColumnB ColumnC Value1 Value2 id
0      A1      B1      C1     v1     v2  1
1      A2      B2      C2     v1     v2  1
2      A3      B3      C3     v1     v2  1

如果您没有NaN数据。

In [1734]: df1.join(df2).ffill()
Out[1734]:
  ColumnA ColumnB ColumnC Value1 Value2 id
0      A1      B1      C1     v1     v2  1
1      A2      B2      C2     v1     v2  1
2      A3      B3      C3     v1     v2  1

Pandas：如何将新列附加到数据框中的所有行

3 个答案: