我为大型数据集生成了箱形图,其中显示了基因型对剪接率的影响,结果,箱形图包含了许多离群值,由于它们压缩了箱形图的大小,因此我可以忽略使用(离群值.colour = NA),但是当我尝试使用scale_y_continuous(limits = c(lower,upper))重置ylim时,它会改变整个动态。有人可以帮助我改变箱形图的高度,以便我清楚地看到变化。
这篇文章是相关的,但我无法解决此问题。
Ignore outliers in ggplot2 boxplot
我已使用以下代码进行绘制:
Trans <- read.delim("EXAMPLES/AT1G04170_SR_2", header=TRUE,
sep="\t")
Trans_1 <-
ggplot(data=Trans,mapping=aes(x=Genotype,y=Ratio,fill=Isoforms))
+geom_boxplot(outlier.colour = NA)
数据
sample Isoforms Ratio Genotype
108 AT1G04170_JC4 0.114555061397559 CC
139 AT1G04170_JC4 1.43188141139633E-07 CC
159 AT1G04170_JC4 0.974829214147311 CT
108 AT1G04170_P1 0.885444938602441 CC
139 AT1G04170_P1 0.980915433730349 CC
159 AT1G04170_P1 0.025170785852689 CT
108 AT1G04170_P2 0 CC
139 AT1G04170_P2 0 CC
159 AT1G04170_P2 0 CT
108 AT1G04170_c1 0 CC
139 AT1G04170_c1 0.01908442308151 CC
159 AT1G04170_c1 0 CT
我希望减少ggplot中的箱形图,以便我能正确看到颜色。
当前图片: https://ibb.co/S3gS2KR
答案 0 :(得分:0)
首先-不知道为什么会看到这么多异常值。当我运行您的代码时,看不到任何内容。
第二个-这不是异常问题,而是扩展问题。也就是说,与y的最小值和最大值相比,样本的变异性较小。您可以使图更大。如果您使用的是RStudio,则可以在代码块标题中执行以下操作:
```{r, fig.height=8}
ggplot(data=Trans,mapping=aes(x=Genotype,y=Ratio,fill=Isoforms)) +
geom_boxplot(outlier.colour = NA)
```
第三-您将无法使右边的5个框变大,因为所有这些值都相同,即所有值= 0。
编辑:仔细查看您的数据,这些值并非全为0,而是回到基本问题,与y-min和y-max相比,这些值是如此接近。