我正在使用GenomicRanges来查找来自一个实验的哪些成绩单与来自其他成绩的成绩单重叠。
head(to_ranges1)
knowngene chr strand Start Gene
1 uc001aaa.3 chr1 + 9873 16409 DDX11L1
2 uc001aac.4 chr1 - 12361 31370 WASH7P
3 uc001aae.4 chr1 - 12361 21759 WASH7P
library(GenomicRanges)
object_one<-with(to_ranges, GRanges(chr, IRanges(Start,End),
strand,names=knowngene,Gene=Gene)
object_two<-with(to_ranges, GRanges(chr, IRanges(Start,End),
strand,names=knowngene, Gene=Gene))
mm<-findOverlaps(object_one,object_two)
solution <- data.frame(as.data.frame(object_one[as.matrix(mm)[,1],]),
as.data.frame(object_two[as.matrix(mm)[,2],]))
我想要找到的是解决方案数据框中命中之间重叠段的宽度,但是我可以得到的唯一宽度是与重叠过程之前的原始记录相关。
你帮我请求了吗?答案 0 :(得分:5)
您可以在点击类(ranges
的结果)上应用findOverlaps
函数。范围返回一个范围,该范围包含范围对象查询和主题中范围的交集。
你没有提供可重复的例子,所以这里有一个例子:
query <- IRanges(c(1, 4, 9), c(5, 7, 10))
subject <- IRanges(c(2, 2, 10), c(2, 3, 12))
mm <- findOverlaps(query,subject)
ranges(mm,query,subject)
Ranges of length 3
start end width
[1] 2 2 1
[2] 2 3 2
[3] 10 10 1