使用loop和if else语句有条件地处理(bgzip,tabix)文件

时间:2016-04-21 11:02:01

标签: r if-statement bioinformatics

我有一些.vcf个文件。我从我的目录中选择了这些文件,并希望将它们转换为其他两种格式。

我在这里使用ifelse if有点困惑。我想这样做:如果.bgz [i]文件没有.vcf文件,我想将其转换为保留原始文件的.bgz文件。

如果.bgz .bgz.tbi[i]文件已有.bgz个文件但不是.bgz文件,那么我想将.bgz.tbi文件转换为{{ 1}}文件保留我从.bgz文件获得的原始.vcf

有人可以帮我完成这个循环吗?它适用于if条件,但不知道如何从那里开始。

  path.file<-"/mypath/for/files/" 
  all.files <- list.files("/mypath/for/files")
  all.files <- all.files[grepl(".vcf$",all.files)]

for (i in 1:length(all.files)){
 if(!exists(paste0(all.files[i],".bgz"))){
  bgzip(paste0(path.file,all.files[i]), overwrite=FALSE)
  }else{(!exists(paste0(all.files[i],".bgz",".tbi"))){
  #if(!exists(paste0(all.files[i],".bgz",".tbi"))){
  indexTabix(paste0(paste0(path.file,all.files[i]),".bgz"), format="vcf")
  }
 }

1 个答案:

答案 0 :(得分:3)

试试这个(未经测试):

#get VCF files with path
all.files <- list.files("/mypath/for/files", pattern = "*.vcf$",
                        full.names = TRUE)

for (i in all.files) {
  #make output names, so we don't mess about with paste
  file_bgz <- paste0(i, ".bgz")
  file_bgz_tbi <- paste0(i, ".bgz.tbi")

  #if bgz exists don't zip else zip
  if(!exists(file_bgz))
    bgzip(i, paste0(i, ".bgz"))

  #if tbi exists don't index else tabix
  if(!exists(file_bgz_tbi))
    indexTabix(file_bgz, format = "vcf")
  }