如何在pandas中替换部分数据帧

时间:2017-07-14 01:33:48

标签: python pandas dataframe

我有像这样的样本数据框

df1=

A B C
a 1 2
b 3 4
b 5 6 
c 7 8
d 9 10

我想用此数据框替换此数据框的一部分(col A = a和b)

df2=

A B C
b 9 10
b 11 12
c 13 14

我想得到以下结果

df3=

A B C
a 1 2
b 9 10
b 11 12
c 13 14
d 9 10

我试过

df1[df1.A.isin("bc")]...

但我无法弄清楚如何更换。 有人告诉你如何替换数据帧。

3 个答案:

答案 0 :(得分:1)

正如我所解释的那样尝试update

import pandas as pd


 df1 = pd.DataFrame({"A":['a','b','b','c'], "B":[1,2,4,6], "C":[3,2,1,0]})

 df2 = pd.DataFrame({"A":['b','b','c'], "B":[100,400,300], "C":[39,29,100]}).set_index(df1.loc[df1.A.isin(df2.A),:].index)

 df1.update(df2)

Out[75]: 
   A      B      C
0  a    1.0    3.0
1  b  100.0   39.0
2  b  400.0   29.0
3  c  300.0  100.0

答案 1 :(得分:1)

A需要combine_firstupdate,但因为需要重复cumcount

df1['g'] = df1.groupby('A').cumcount()
df2['g'] = df2.groupby('A').cumcount()
df1 = df1.set_index(['A','g'])
df2 = df2.set_index(['A','g'])

df3 = df2.combine_first(df1).reset_index(level=1, drop=True).astype(int).reset_index()
print (df3)
   A   B   C
0  a   1   2
1  b   9  10
2  b  11  12
3  c  13  14
4  d   9  10

另一种解决方案:

df1['g'] = df1.groupby('A').cumcount()
df2['g'] = df2.groupby('A').cumcount()
df1 = df1.set_index(['A','g'])
df2 = df2.set_index(['A','g'])

df1.update(df2)
df1 = df1.reset_index(level=1, drop=True).astype(int).reset_index()
print (df1)
   A   B   C
0  a   1   2
1  b   9  10
2  b  11  12
3  c  13  14
4  d   9  10

如果Adf1df2的重复内容在df2.index = df1.index[df1.A.isin(df2.A)] df3 = df2.combine_first(df1) print (df3) A B C 0 a 1.0 2.0 1 b 9.0 10.0 2 b 11.0 12.0 3 c 13.0 14.0 4 d 9.0 10.0 中相同且长度相同:

next next a

答案 2 :(得分:0)

您可以通过以下方式解决问题:

import pandas as pd

df1 = pd.DataFrame({'A':['a','b','b','c','d'],'B':[1,3,5,7,9],'C':[2,4,6,8,10]})

df2 = pd.DataFrame({'A':['b','b','c'],'B':[9,11,13],'C':[10,12,14]}).set_index(df1.loc[df1.A.isin(df2.A),:].index)

df1.loc[df1.A.isin(df2.A), ['B', 'C']] = df2[['B', 'C']]

Out[108]: 
   A   B   C
0  a   1   2
1  b   9  10
2  b  11  12
3  c  13  14
4  d   9  10