我一直在尝试使用RCircos软件包几周,每次运行代码时都会遇到一个我无法理解的错误。 我的数据:
Chr Start End Gene
1 chr1 801943 801943 LOC643837(dist=12203),FAM41C(dist=1508)
2 chr1 802289 802289 LOC643837(dist=12549),FAM41C(dist=1162)
3 chr1 802300 802300 LOC643837(dist=12560),FAM41C(dist=1151)
4 chr1 802320 802320 LOC643837(dist=12580),FAM41C(dist=1131)
5 chr1 802338 802338 LOC643837(dist=12598),FAM41C(dist=1113)
6 chr1 802381 802381 LOC643837(dist=12641),FAM41C(dist=1070)
我的代码:
> library(RCircos)
> setwd("~/Desktop/")
> data("UCSC.HG19.Human.CytoBandIdeogram")
> my_data <-read.csv("data.csv", header = T, sep="\t")
> cyto.info <-UCSC.HG19.Human.CytoBandIdeogram
> tracks.inside <-10
> tracks.outside <-0
>chr.exclude <-NULL
> RCircos.Set.Core.Components ( cyto.info, chr.exclude, tracks.inside,tracks.outside)
> pdf("Rcircos.pdf", height = 8, width = 8, compress = T)
> RCircos.Set.Plot.Area()
> RCircos.Chromosome.Ideogram.Plot()
>name.col <-4
> side <-"in"
> track.num <-1
> RCircos.Gene.Connector.Plot(genomic.data= my_data, track.num =
track.num, side=side) track.num <-2
> RCircos.Gene.Name.Plot(my_data, name.col,track.num, side)
> dev.off()
我得到的错误是:“RCircos.Validate.Genomic.Data中的错误(genomic.data = my_data,plot.type = c(”plot“),:情节数据中的某些染色体不在表意文字中。”
我已经尝试过改变cytoband表意文字并且仍然没有使用hg38,我检查了我的数据并且所有的染色体都在,开始和结束位置都是从UCSC发现的cytoband信息的范围。我已经阅读了大部分有关此软件包的文档但仍然没有,有一个简单的解决方案我很确定,但我无法弄清楚这一点。如果有人能向我解释错误在哪里以及我应该尝试什么,我将非常感激。
提前谢谢
答案 0 :(得分:0)
我遇到了同样的问题。您可以通过更改表意文字来解决此问题。在您的代码中可以清楚地看到,您正在使用这个表意文字UCSC.HG19.Human.CytoBandIdeogram
,它是人类基因组注释的旧版本。如果你使用这个,我希望你能解决这个问题:
data("UCSC.HG38.Human.CytoBandIdeogram")
cyto.info <- UCSC.HG38.Human.CytoBandIdeogram;
最佳, 梅迪