Rcircos绘图包

时间:2017-05-11 10:03:19

标签: r

我一直在尝试使用RCircos软件包几周,每次运行代码时都会遇到一个我无法理解的错误。 我的数据:

Chr  Start    End                                    Gene
1 chr1 801943 801943 LOC643837(dist=12203),FAM41C(dist=1508)
2 chr1 802289 802289 LOC643837(dist=12549),FAM41C(dist=1162)
3 chr1 802300 802300 LOC643837(dist=12560),FAM41C(dist=1151)
4 chr1 802320 802320 LOC643837(dist=12580),FAM41C(dist=1131)
5 chr1 802338 802338 LOC643837(dist=12598),FAM41C(dist=1113)
6 chr1 802381 802381 LOC643837(dist=12641),FAM41C(dist=1070)

我的代码:

> library(RCircos)   
> setwd("~/Desktop/")   
> data("UCSC.HG19.Human.CytoBandIdeogram")    
> my_data <-read.csv("data.csv", header = T, sep="\t")     
> cyto.info <-UCSC.HG19.Human.CytoBandIdeogram   
> tracks.inside <-10
> tracks.outside <-0    
>chr.exclude <-NULL   
> RCircos.Set.Core.Components ( cyto.info, chr.exclude, tracks.inside,tracks.outside)
> pdf("Rcircos.pdf", height = 8, width = 8, compress = T) 
> RCircos.Set.Plot.Area()  
> RCircos.Chromosome.Ideogram.Plot()  
>name.col <-4  
> side <-"in"
> track.num <-1
> RCircos.Gene.Connector.Plot(genomic.data= my_data, track.num =
track.num,  side=side)   track.num <-2 
> RCircos.Gene.Name.Plot(my_data, name.col,track.num, side)
> dev.off()

我得到的错误是:“RCircos.Validate.Genomic.Data中的错误(genomic.data = my_data,plot.type = c(”plot“),:情节数据中的某些染色体不在表意文字中。”

我已经尝试过改变cytoband表意文字并且仍然没有使用hg38,我检查了我的数据并且所有的染色体都在,开始和结束位置都是从UCSC发现的cytoband信息的范围。我已经阅读了大部分有关此软件包的文档但仍然没有,有一个简单的解决方案我很确定,但我无法弄清楚这一点。如果有人能向我解释错误在哪里以及我应该尝试什么,我将非常感激。

提前谢谢

1 个答案:

答案 0 :(得分:0)

我遇到了同样的问题。您可以通过更改表意文字来解决此问题。在您的代码中可以清楚地看到,您正在使用这个表意文字UCSC.HG19.Human.CytoBandIdeogram,它是人类基因组注释的旧版本。如果你使用这个,我希望你能解决这个问题:

data("UCSC.HG38.Human.CytoBandIdeogram")    
cyto.info <- UCSC.HG38.Human.CytoBandIdeogram;

最佳, 梅迪