我有一个数据框mdata
,如下所示:
>head(mdata)
ID variable value
SJ5444_MAXGT coding 4.241920
SJ5426_MAXGT coding 4.254331
HR1383_MAXGT coding 4.244994
HR5522_MAXGT missense 4.250347
CH30041_MAXGT missense 4.303174
SJ5438_MAXGT utr.3 4.242218
我试图画出这样的小提琴情节:
x1<- mdata$value[mdata$variable=='coding']
x2<- mdata$value[mdata$variable=='missense']
x3<- mdata$value[mdata$variable=='utr.3']
vioplot(x1, x2, x3, names=as.character(unique(mdata$variable)), col="red")
title("Violin Plot: Log10 values")
但我有另一个数据框ndata
,如下所示:
>head(ndata)
ID variable value
SJ5444_MAXGT coding 17455
SJ5426_MAXGT coding 17961
HR1383_MAXGT coding 17579
HR5522_MAXGT missense 17797
CH30041_MAXGT missense 20099
SJ5438_MAXGT utr.3 17467
基本上mdata $值是:
mdata$value = log10(ndata$value)
所以我可以让小提琴的情节好起来。但是我需要更改Y轴标签以匹配ndata $值而不是mdata $ value。我正在绘制mdata $值,但希望从ndata $ value中获取Y轴标签。仅供参考,这是实际数据的一个子集。实际数据中的最小值和最大值为12&amp; 36937,我知道如何使用以下方法在箱线图上绘制:
axis(side=2,labels=round(10^(seq(log10(min(ndata$value)),log10(max(ndata$value)),len=5))),at=seq(log10(min(ndata$value)),log10(max(ndata$value)),len=5))
但是我不能在Yiolin图中绘制Y轴标签以匹配ndata $值。有什么建议吗?
P.S。我找不到代码vioplot
或violinplot
,因此我无法对其进行标记。
答案 0 :(得分:2)
vioplot
不是很灵活 - 它不允许您关闭轴标签或修改它们 - 但您可以先创建自己的空图,然后将小提琴图添加到其中vioplot(...,add=TRUE)
,然后手动添加标签,如下所示:
## make up data
set.seed(101)
x1 <- rlnorm(1000,meanlog=3,sdlog=1)
x2 <- rlnorm(1000,meanlog=3,sdlog=2)
x3 <- rlnorm(1000,meanlog=2,sdlog=2)
现在创建情节:
library(vioplot)
par(las=1,bty="l") ## my preferred setting
## set up empty plot
plot(0:1,0:1,type="n",xlim=c(0.5,3.5),ylim=range(log10(c(x1,x2,x3))),
axes=FALSE,ann=FALSE)
vioplot(log10(x1),log10(x2),log10(x3),add=TRUE)
axis(side=1,at=1:3,labels=c("first","second","third"))
axis(side=2,at=-2:4,labels=10^(-2:4))
或者,您可以使用ggplot2::geom_violin()
和scale_y_log10()
(我认为)。
答案 1 :(得分:1)
根据Ben Bolker的建议,我使用了ggplot2 :: geom_violin()并实现了我想要的效果,绘制log10(值),但在Y轴上使用以下标记“值”:
ggplot(mdata, aes(variable, log10(value))) + geom_violin(colour="black",fill="red")
+ scale_y_continuous(
breaks = seq(log10(min(mdata$value)),log10(max(mdata$value)),len=5),
labels = round(10^(seq(log10(min(mdata$value)),log10(max(mdata$value)),len=5)))
)