根据条件替换不同文件中的字符串

时间:2018-10-26 10:19:15

标签: python string pandas csv dataframe

我是Python编码的新手,我遇到了有关csv文件数据操作的问题。

基本上,由于pd.read_csv,我导入了2个csv文件

df1 which has 9 rows including headers and 5 columns

df2 which has 65 rows including headers and same 5 columns

我想将df1中的句子替换为'NBIMAGE'中的df2中的句子,并保存名为df3的第三个csv(或者只是将df1的修改版本另存为df1而没有新文件)

换句话说,只要df1中的'NBIMAGE'= df2中的'NBIMAGE'(即使行不同),都应该用df2中相同的'NBIMAGE'语句替换df1中该行的句子< / em>

我要做的是

df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')

df1['newcolumn'] = 
np.where (df1['NBIMAGE'] == df2['NBIMAGE'], df2['SENTENCE'], 0) 

但是它输出一个 ValueError: Can only compare identically-labeled Series objects

我不想使用replace,因为我们需要指定要替换的内容,但我认为对字符串使用numpy也不是最佳解决方案。...

希望您能理解我的问题,并感谢大家的帮助!

1 个答案:

答案 0 :(得分:1)

df3 = df1.drop('SENTENCE',axis=1).merge(df2[['NBIMAGE','SENTENCE']],how='left', on='NBIMAGE')