如何从fasta文件中获取基因组坐标

时间:2016-11-22 21:56:41

标签: r fasta bioconductor genome iranges

由于更新了参考基因组,我必须从旧序列(从床文件)获取fasta,以在最后一个版本中找到新坐标。

所以,从我的名为“my.fasta”的fasta文件中,(有35个序列)

我在此之后创建了一个“DNAStringSet”对象:

 library ("GenomicRanges")
 setwd("/pwd")
 pwd  <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
 path <- system.file("pwd", package = "rGADEM")
 FastaFile <- paste(pwd, path, sep = "")
 Sequences <- readDNAStringSet(FastaFile, "fasta")
 Sequences

 A DNAStringSet instance of length 35
     width seq                                              names
 [1]   300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
 [2]   300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT

最后,我尝试使用rGADEM从我的fasta中提取坐标:

library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)

startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
芽没有工作。 如何从fasta文件中提取坐标? 我需要一张IRange,床或类似的东西。 谢谢。

0 个答案:

没有答案