我有以下数据:
import pandas as pd
df1 = pd.DataFrame({'ISIN': ['A1', 'B2', 'C3', 'D4']})
df1['%'] = 0.5
print(df1)
ISIN %
0 A1 0.5
1 B2 0.5
2 C3 0.5
3 D4 0.5
df2 = pd.DataFrame({'ISIN': ['C3', 'D4', 'E5', 'F6']})
df2['%'] = 0.2
print(df2)
ISIN %
0 C3 0.2
1 D4 0.2
2 E5 0.2
3 F6 0.2
我希望键(ISIN)检查它们是否在两个数据帧中匹配,如果它们匹配,则将%从df2添加到df1。因此,期望的输出将是:
print(df1)
ISIN %
0 A1 0.5
1 B2 0.5
2 C3 0.7
3 D4 0.7
我尝试过以下代码但是python似乎不喜欢For循环,因为有两个数据帧。没有错误,只是总和没有发生:
for row in df1['ISIN']:
if df1['ISIN'].isin(df2['ISIN']) is True:
df1.loc[row, '%'] = df1.loc[row, '%']+df2.loc[row,'%']
答案 0 :(得分:2)
您可以使用map
执行此操作:
In [32]:
df1['%'] = (df1['%'] + df1['ISIN'].map(df2.set_index('ISIN')['%'])).fillna(df1['%'])
df1
Out[32]:
ISIN %
0 A1 0.5
1 B2 0.5
2 C3 0.7
3 D4 0.7
答案 1 :(得分:1)
我喜欢Ed的一个班轮。
这是一种更明确的替代解决方案。首先合并df2,然后添加两列。最后,通过删除合并列来清理。
df1 = df1.merge(df2, how='left', on='ISIN', suffixes=('', '_df2'))
>>> df1
ISIN % %_df2
0 A1 0.5 NaN
1 B2 0.5 NaN
2 C3 0.5 0.2
3 D4 0.5 0.2
mask = df1['%_df2'].isnull()
df1.loc[~mask, '%'] += df1.loc[~mask, '%_df2']
del df1['%_df2']
>>> df1
ISIN %
0 A1 0.5
1 B2 0.5
2 C3 0.7
3 D4 0.7