我有404行的数据框:
test
1 OTU3978
2 OTU4011
3 OTU4929
4 OTU4317
5 OTU4816
6 OTU3902
我还有一个1105854行的数据框:
var1 var2 corr
1 OTU3978 UniRef90_A0A010P3Z8 0.846
2 OTU4011 UniRef90_A0A010P3Z8 0.855
3 OTU4929 UniRef90_A0A010P3Z8 0.829
4 OTU4317 UniRef90_A0A011P550 0.850
5 OTU4816 UniRef90_A0A011P550 0.807
6 OTU3902 UniRef90_A0A011QPQ2 0.836
我想保留找到第一个数据框值的第二个数据框的行。例如,在我的示例中,应该保存第二个数据帧的所有行。
两个数据帧之间的匹配在第二个数据帧的第一列上完成。例如,可以在第二个df的第一列中多次找到值OTU3978
(第一个df)。
我试图做一个嵌套循环,但是没有成功。
答案 0 :(得分:1)
使用dplyr
包,假设您的df名称为df1
和df2
:
inner_join(df1, df2, by = c('test' = 'var1))