使用R或Excel比较数据框中的两列

时间:2018-02-19 12:18:29

标签: r excel dplyr compare

我有一个包含两列的csv文件," Taxon"在A栏和"提示"在列C中,我想将列A与列C进行比较,如果字符串与列C中的另一个字符串相匹配,我希望它能够打印" y"或者列A中字符串旁边的B列中的类似内容,如果不是,我想打印" n"或同等学历。这是我数据的开头:

Taxon                                   B     Tip
Nitrosotalea devanaterra                     Methanothermobacter thermautotrophicus
Nitrososphaera gargensis                     Methanobacterium beijingense
Nitrososphaera sca5445                       Methanobacterium bryantii
Nitrososphaera sca2170                       Methanosarcina mazei
Methanobacterium beijingense                 Persephonella marina
Methanobacterium bryantii                    Sulfurihydrogenibium azorense
Methanothermobacter thermautotrophicus       Balnearium lithotrophicum
Methanosarcina mazei                         Isosphaera pallida
Koribacter versatilis                        Methanobacterium beijingense
Acidicapsa borealis                          Parachlamydia acanthamoebae
Acidobacterium capsulatum                    Leptospira biflexa

这只是数据的一小部分,但其想法是" n"除了" Methanobacterium beijingense"之外,所有细菌都将在B栏中打印出来。和#34; Methanobacterium bryantii",也发现在"提示"专栏" y"会张贴在那里。这些也可能只是" 1"和" 0"。

我知道dplyr在过滤和加入数据方面有一些很好的功能,但我无法找到与我的需求完全匹配的东西。如果有另一种使用Excel的方法来做到这一点也很好。

感谢。

2 个答案:

答案 0 :(得分:2)

对于,请在B2中使用以下公式

=if(isnumber(match(a2, c:c, 0)), "y", "n")

向下或双击“拖动按钮”。

答案 1 :(得分:0)

使用command.Parameters.Add(new SqlParameter("@id", create_user_username_textbox.Text)); command.Paramaters.Add(new SqlParameter("@pw", create_user_password_textbox.Text)); r的方法:

dplyr