我有两个数据框,data1和data2,分别包含~1000个基因1-100位的var1和var2的测量值。
数据格式示例:
Gene Name X1-var1 X2-var1 X3-var1 ... X100-var1
Gene1 0.5 0.3 0.2 0.9
Gene2 1.1 0.6 0.3 2.5
Gene3 4.5 2.0 9.8 1.2
...
Gene2000 0.7 2.3 3.9 ... 0.8
以前,我使用ggplot绘制了data1与位置的var1,每个基因都标记为不同的颜色(系列):
library(ggplot2)
library(reshape)
genes <- data.frame(x=seq(1,100), t(data1))
genes.melted <- melt(genes,id="x")
ggplot(data=genes.melted, aes(x=x,y=value,color=variable))+geom_line()
现在,我想绘制var1与var2的关系,var1-var2配对由位置和基因决定,并使用原始位置信息来确定颜色(忽略基因信息)。 也就是说,我想绘制积分
(X1-var1 for Gene1, X1-var2 for Gene1),(X1-var1 for Gene2, X1-var2 for Gene2),(X1-var1 for Gene3, X1-var2 for Gene3),..., (X1-var1 for Gene2000, X1-var2 for Gene2000)
一种颜色,
(X2-var1 for Gene1, X2-var2 for Gene1),(X2-var1 for Gene2, X2-var2 for Gene2),(X2-var1 for Gene3, X2-var2 for Gene3),..., (X2-var2 for Gene2000, X2-var2 for Gene2000)
另一种颜色,依此类推。 当我的x变量对于每个组都不相同时,我很困惑如何做到这一点 - 以前,当我绘制与位置时,x变量保持不变。