我有一个数据集,如:
> data<-c( "IGHV1-2*02 F, or IGHV1-2*03 F","IGHV3-23*01 F, or
> IGHV3-23*04 F","IGHV2-70*01 F","IGHV7-4-1*01")
我想保留“V1-2”的第一个外观,并删除后面的任何内容(包括“*”)。 所以我尝试了以下内容:
> data.substr<-substr(data,4,9)
> data.substr1<-gsub("*","",data.substr)
但我仍然无法摆脱“*”,可能是因为它作为占位符...... 有没有人有想法?
答案 0 :(得分:6)
gsub("[*].*$","",data)
将*
放在方括号中,它将被视为字符,然后将删除任何值.*
,直到字符串$
的结尾。