我有两个数据集可供比较,例如hapmap.table和thousand_genomes.table。我正在使用merge()函数搜索和检索类似的记录。但是在hapmap文件中,染色体编号输入为chr1,chr2等,而其他只表示为数字。如何在合并之前从整个数据集中删除字符chr,非常感谢。
答案 0 :(得分:1)
假设chrom是hapmap.table中的染色体编号列
gsub("^chr","",hapmap.table$chrom)
示例:
hh<-structure(list(hh = structure(1:3, .Label = c("chr12", "chr23",
"chr45"), class = "factor")), .Names = "hh", row.names = c(NA,
-3L), class = "data.frame")
hh
hh
1 chr12
2 chr23
3 chr45
hh$hh<- gsub("^chr","",hh$hh)
hh
hh
1 12
2 23
3 45