调用getPromoterSeq(GenomicFeatures程序包)后,键112(字符'p')不在Biostrings的查找表中

时间:2019-02-13 21:40:57

标签: r bioinformatics bioconductor genomicranges

尝试通过getPromoterSeq(GenomicFeatures软件包)从TxDb.Hsapiens.UCSC.hg19.knownGene获取启动子序列时失败

library(TxDb.Hsapiens.UCSC.hg19.knownGene)
library(BSgenome.Hsapiens.UCSC.hg19)
library(Homo.sapiens)

promoter.gr = transcriptsBy(TxDb.Hsapiens.UCSC.hg19.knownGene, by='gene')[11338]
promoter.seq = getPromoteSeq(promoter.gr, Hsapiens, upstream=3000, downstream=0)
promoter.seq

结果如下:

DNAStringSetList of length 1
Error in .Call2("new_CHARACTER_from_XStringSet", x, xs_dec_lkup(x), PACKAGE='Biostrings'):
key 112 (char 'p') not in lookup table. 

我搜索有关此错误的其他讨论。似乎当人们尝试加载序列文件时,序列文件中存在非T,C,G,A序列,主要是“ p”。尽管这里我什至没有在本地提供序列,但都是从软件包中提供的。

0 个答案:

没有答案