由于更新了参考基因组,我必须从旧序列(从床文件)获取fasta,以在最后一个版本中找到新坐标。
所以,从我的名为“my.fasta”的fasta文件中,(有35个序列)
我在此之后创建了一个“DNAStringSet”对象:
library ("GenomicRanges")
setwd("/pwd")
pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
path <- system.file("pwd", package = "rGADEM")
FastaFile <- paste(pwd, path, sep = "")
Sequences <- readDNAStringSet(FastaFile, "fasta")
Sequences
A DNAStringSet instance of length 35
width seq names
[1] 300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
[2] 300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT
最后,我尝试使用rGADEM从我的fasta中提取坐标:
library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)
startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
芽没有工作。
如何从fasta文件中提取坐标?
我需要一张IRange,床或类似的东西。
谢谢。