R - 如何使用另一列的字符串集

时间:2018-02-28 17:22:22

标签: r dplyr

我基本上试图“背景减去”我拥有的数据。所以这里我有两个样本数据集。请注意,'m / z'列不能用于减法,因为相关的数字并不总是完全相同。有多个字符串,我不知道如何做到这一点,我甚至不确定我是否正在问正确的问题,因为我是新手。

解决方案 = df_sub< - anti_join(df,dfbkg,by ='Composition')(这也适用于字符串!)

df <- read.csv(file)

m/z             Composition

241             C15 H22 O Na                
265             C15 H15 N5 
301             C16 H22 O4 Na 
335             C19 H20 O4 Na           
441             C26 H42 O4 Na 

和我的“背景”

df_bkg <- read.csv(file_2)

m/z             Composition

274             C18 H19 O Na 
301             C16 H22 O4 Na 
317             C16 H22 O5 Na       
441             C26 H42 O4 Na 
241             C15 H22 O Na 

与我的数据相比,背景在“合成”列中包含三个相似的字符串。我希望新的“减去数据集”看起来像这样..

df_sub <- (df - df_bkg)

m/z             Composition

274             C18 H19 O Na  
317             C16 H22 O5 Na       

感谢您提供任何帮助。

1 个答案:

答案 0 :(得分:0)

尝试使用:

data = [11,2,0,34,8,4]
new_data = [ if x for x in data  ]
print( new_data )

代码只选择df中没有出现的df_bkg行!我希望这回答了你的问题!