使用readGAlignments()将循环读取映射(BAM)读入R

时间:2015-02-18 22:45:45

标签: r bioconductor

我正在尝试使用ggbio包在R中创建循环基因组图谱。我是ggbio和GenomicAlignments和GenomicRanges等相关软件包的新手。

我将读取映射导出为BAM文件(带有关联的索引文件),并尝试使用readGAlignmentsFromBam()读取文件。

    myreads <- readGAlignmentsFromBam("final.assembly", index = "final.assembly", use.names = TRUE)

但我总是得到

警告讯息: 在GenomicRanges ::: valid.GenomicRanges.seqinfo(x): GAlignments对象包含位于序列上的12006个越界范围 共识。注意,只有位于非圆形序列上的范围 长度不是NA可以被认为是越界(使用seqlengths()和 isCircular()获取底层的长度和圆形标志 序列)。

哪个有意义 - 它是一个圆形染色体,所以有些读数将在“线性”参考序列之外。问题是,我该如何解决?我试图添加isCircular = c(TRUE)作为参数,但这没有帮助。似乎某处有一个标志(在B代码文件中?在R代码中?)应该设置哪个不是,但我无法弄清楚在哪里。

抱歉没有可重复的示例,但这是一个巨大的BAM文件,我对文件类型不够熟悉,无法模拟数据。

0 个答案:

没有答案