我有一个庞大的数据库,其中列出了抗生素抗性基因作为数据框中变量的一部分。我想编写一个脚本,自动将基因所属的正确抗生素组分配给一个新的相应变量。例如:
Nr Gene
[1] 1 "TEM-1, CTX-M-12, CTX-M-14, ampC"
[2] 2 "VIM, blaCMY, CTX-M-24"
现在,例如,如果我要分配所有含有" CTX"和" CMY" β-内酰胺酶和" VIM"对于万古霉素,它应该回归:
Nr Gene Group
[1] 1 "TEM-1, CTX-M-12, CTX-M-14, ampC" "beta-lactamases"
[2] 2 "VIM, blaCMY, CTX-M-24" "beta-lactamases, Vancomycin"
我尝试过使用if函数:
if ("*CTX*" or "*CMY*" %in% df$Gene) {
df$Group <- paste("beta-lactamases")
}
但是不起作用。任何帮助,将不胜感激。