删除用于合并r中两个数据集的字符子字符串

时间:2013-10-18 20:58:51

标签: r

我有两个数据集可供比较,例如hapmap.table和thousand_genomes.table。我正在使用merge()函数搜索和检索类似的记录。但是在hapmap文件中,染色体编号输入为chr1,chr2等,而其他只表示为数字。如何在合并之前从整个数据集中删除字符chr,非常感谢。

1 个答案:

答案 0 :(得分:1)

假设chrom是hapmap.table中的染色体编号列

gsub("^chr","",hapmap.table$chrom)

示例:

hh<-structure(list(hh = structure(1:3, .Label = c("chr12", "chr23", 
"chr45"), class = "factor")), .Names = "hh", row.names = c(NA, 
-3L), class = "data.frame")

 hh
     hh
1 chr12
2 chr23
3 chr45

hh$hh<- gsub("^chr","",hh$hh)

 hh
  hh
1 12
2 23
3 45