R boxplot标题异常值

时间:2016-06-21 15:34:13

标签: r visualization title boxplot

我尝试制作一个好的Boxplot。正如您在图片中看到的那样,为了获得清晰的可视化,有必要“放大”到数据的最大部分。 我用ylim选项做了这个。

正如你在下面的图片中看到的,我创建了一个主标题,异常值正在通过标题,这就是问题所在。

我想我可以通过删除原始数据中的异常值来解决问题,但我想知道是否可以将“boxplotline”减少0.10,因此箱图保持在图中。

到目前为止我的代码:

 boxplot (genergy$Measurevalue, ylim= c(0,0.1), ylab = "Measured Value", 
     main="Boxplot Measured Value", col = "red")

Boxplot

更新: @Twitch_City:我不认为使用另一个ylim是解决方案。例如:

boxplot (genergy$Measurevalue, ylim= c(0,0.50), ylab = "Measured Value", 
     main="Boxplot Measured Value", col = "red")

enter image description here

@ akash87,当然。数据是:

enter image description here

1 个答案:

答案 0 :(得分:0)

您可以使用outline=FALSE来避免完全绘制异常值。然后,您可以单独提供有关异常值的数据(例如,使用fivenum或其他摘要)。

这是一个使用从卡方分布生成的随机数据的例子,df = 3;正如您的数据所显示的那样,数据非常正面。保存boxplot统计信息以获取异常值的信息。

N=500000
dat <- rchisq(N, 3)
dat.box <- boxplot(dat, cex=.5, outline=F, las=1)
cat(fivenum(dat.box$out))

另一种选择是绘制核密度曲线并添加对应于所需分位数的线。如下:

plot(density(dat), las=1)
abline(v=median(dat), col='black')
abline(v=quantile(dat, .25), lty=3, col='red')
abline(v=quantile(dat, .75), lty=3, col='red')