分配对应于相应数据帧R中的多个名称的组名

时间:2018-04-19 09:15:55

标签: r dataframe

我有一个庞大的数据库,其中列出了抗生素抗性基因作为数据框中变量的一部分。我想编写一个脚本,自动将基因所属的正确抗生素组分配给一个新的相应变量。例如:

    Nr  Gene
[1] 1  "TEM-1, CTX-M-12, CTX-M-14, ampC"
[2] 2  "VIM, blaCMY, CTX-M-24"

现在,例如,如果我要分配所有含有" CTX"和" CMY" β-内酰胺酶和" VIM"对于万古霉素,它应该回归:

    Nr  Gene                               Group
[1] 1   "TEM-1, CTX-M-12, CTX-M-14, ampC"  "beta-lactamases"
[2] 2   "VIM, blaCMY, CTX-M-24"            "beta-lactamases, Vancomycin"

我尝试过使用if函数:

if ("*CTX*" or "*CMY*" %in% df$Gene) {
  df$Group <- paste("beta-lactamases")
}

但是不起作用。任何帮助,将不胜感激。

0 个答案:

没有答案