我如何更新'一个df基于共享公共密钥的另一个数据帧的值?蟒蛇

时间:2014-07-02 01:54:44

标签: python pandas

如何基于共享公共密钥的另一个数据帧的值更新'a12? 在下面的示例中,公共密钥是列a。

a12 =

  a  b  c
  0  1  1
  1  na na

try10 =

  a  b  c
  1  1  1

当我使用合并时,我得到这样的东西。

pd.merge(a12,try10)=

  a  b  c  b_y  c_y
  0  1  1   na  na
  1  na na  1   1

我决定手动完成,但我认为必须有比下面更加pythonic的方式。我很感激你的帮助。

for i, val in a12.iterrows():
    for x, xval in try10.iterrows():
        if xval['Firm1'] == val['Firm']: 
            try10.ix[x]['AMranking'] =  val['AMranking']
            try10.ix[x]['numlawyers'] = val['numlawyers']
            try10.ix[x]['grossprofits'] = val['grossprofits']  

del try12['firm']

2 个答案:

答案 0 :(得分:1)

您可以使用combine_first方法。 See here.您需要在两个数据框中将所需的密钥设置为索引。

In [128]: a12.set_index ('a').combine_first(try10.set_index('a'))
Out[128]: 
   b  c
a      
0  1  1
1  1  1

答案 1 :(得分:0)

您可以在dropna

之前将a12应用于merge
In [53]:

a12 = pd.DataFrame({'a':[0, 1], 'b':[1, np.nan], 'c':[1, np.nan]})
try10= pd.DataFrame({'a':[1], 'b':[1], 'c':[1]})
In [54]:

print pd.merge(a12, try10, how='outer', left_on='a', right_on='a')
   a  b_x  c_x  b_y  c_y
0  0    1    1  NaN  NaN
1  1  NaN  NaN    1    1
In [55]:

print pd.merge(a12.dropna(0), try10, how='outer')
   a  b  c
0  0  1  1
1  1  1  1

如果a是索引:

In [57]:

print pd.merge(a12.dropna(0).reset_index(), try10.reset_index(), how='outer').set_index('a')
   b  c
a      
0  1  1
1  1  1