由于ggplot中存在大量异常值,调整了箱形图的大小

时间:2019-07-02 16:30:28

标签: r ggplot2 resize boxplot

我为大型数据集生成了箱形图,其中显示了基因型对剪接率的影响,结果,箱形图包含了许多离群值,由于它们压缩了箱形图的大小,因此我可以忽略使用(离群值.colour = NA),但是当我尝试使用scale_y_continuous(limits = c(lower,upper))重置ylim时,它会改变整个动态。有人可以帮助我改变箱形图的高度,以便我清楚地看到变化。

这篇文章是相关的,但我无法解决此问题。

Ignore outliers in ggplot2 boxplot

我已使用以下代码进行绘制:

Trans <- read.delim("EXAMPLES/AT1G04170_SR_2", header=TRUE, 
sep="\t")
Trans_1 <- 
ggplot(data=Trans,mapping=aes(x=Genotype,y=Ratio,fill=Isoforms)) 
+geom_boxplot(outlier.colour = NA) 

数据

   sample   Isoforms    Ratio   Genotype

    108 AT1G04170_JC4   0.114555061397559   CC

    139 AT1G04170_JC4   1.43188141139633E-07    CC

    159 AT1G04170_JC4   0.974829214147311   CT

    108 AT1G04170_P1    0.885444938602441   CC

    139 AT1G04170_P1    0.980915433730349   CC

    159 AT1G04170_P1    0.025170785852689   CT

    108 AT1G04170_P2    0   CC

    139 AT1G04170_P2    0   CC

    159 AT1G04170_P2    0   CT

    108 AT1G04170_c1    0   CC

    139 AT1G04170_c1    0.01908442308151    CC

    159 AT1G04170_c1    0   CT

我希望减少ggplot中的箱形图,以便我能正确看到颜色。

当前图片: https://ibb.co/S3gS2KR

1 个答案:

答案 0 :(得分:0)

首先-不知道为什么会看到这么多异常值。当我运行您的代码时,看不到任何内容。

第二个-这不是异常问题,而是扩展问题。也就是说,与y的最小值和最大值相比,样本的变异性较小。您可以使图更大。如果您使用的是RStudio,则可以在代码块标题中执行以下操作:

```{r, fig.height=8}    
ggplot(data=Trans,mapping=aes(x=Genotype,y=Ratio,fill=Isoforms)) + 
  geom_boxplot(outlier.colour = NA) 

```

第三-您将无法使右边的5个框变大,因为所有这些值都相同,即所有值= 0。

编辑:仔细查看您的数据,这些值并非全为0,而是回到基本问题,与y-min和y-max相比,这些值是如此接近。