对于26000个基因,我有一个像这样的Chip-seq结果数据矩阵
LncRNA_ID LncRNA_Name Control_Raw_TagCount ICLIP_EZH2_Raw_TagCount
1 AK092525 47908 194887
2 ENST00000423879 RP11-12M5.1 10794 90146
3 AF318349 5514 61617
4 ENST00000506392 CTC-313D10.1 288 40880
5 ENST00000438080 RP11-177A2.4 25005 37380
6 AK123756 800 35469
我想绘制两个样本,对照和EZH2(即第3列和第4列)的计数密度,以便比较它们。我正在使用R而且我很困惑,主要是因为我无法将它们绘制为直方图,我得到一个只有一个条形的图形而不是我正在等待的所有条形图,如果我有兴趣做一个箱形图则相同。可能是一个非常愚蠢的问题,但我有点绝望
ezh2<-data$ICLIP_EZH2_Raw_TagCount
control<-data$Control_Raw_TagCount
hist(ezh2)# not working, i can't see distribution at all
你有任何想法吗?
提前致谢
答案 0 :(得分:0)
箱形图,两列粘在一起然后沿着组分开:
N <- length(d$Control_Raw_TagCount)
x <- c(d$Control_Raw_TagCount, d$ICLIP_EZH2_Raw_TagCount)
group <- rep(c("Control_Raw_TagCount", "ICLIP_EZH2_Raw_TagCount"), c(N, N))
boxplot(x ~ group)
此处我假设数据名称为d
,因此请根据您的数据框名称进行调整。如果你想要空心直方图(参见OpenIntro Statistics的第26页),histPlot
包中的openintro
函数将使用参数probability=TRUE, hollow=TRUE
来完成这一操作:
# install.packages("openintro")
library(openintro)
histPlot(d$Control_Raw_TagCount, probability=TRUE, hollow=TRUE)
histPlot(d$ICLIP_EZH2_Raw_TagCount, probability=TRUE, hollow=TRUE,
lty=3, border='red')
如果垂直刻度不正确,请在第一次调用ylim
时添加histPlot
参数(例如ylim=c(0,0.05)
)。