当有很多等于离群值的值时,如何在方框图中标记“离群值”?

时间:2018-10-18 03:39:55

标签: r ggplot2 boxplot

original box plot with 6 outliers

请参考上面的箱形图。我只想标记异常值。 我使用以下代码制作一个标签栏来标记异常值。

outliers_price = boxplot(Ready_to_work_data$median_price ~ 
Ready_to_work_data$Regionname,plot=FALSE)$out
Ready_to_work_data$lable_price <- ifelse(Ready_to_work_data$median_price %in% 
outliers_price, Ready_to_work_data$median_price, "")

现在,当我使用代码geom_text(aes(label = lable_price))时,我看到下面的图(plot2),其中所有匹配值都被突出显示,其中许多不是离群值。我该如何解决?

Plot2 with multiple lables

1 个答案:

答案 0 :(得分:2)

由于问题中没有提供数据,因此很难重现所需的图。但是,这是一种使用非重叠标签标记重叠离群值的解决方案。当点重叠时,标签将不会重叠,因为ggstatsplot在背景中使用了ggrepel

library(ggstatsplot)

ggbetweenstats(
  data = movies_long,
  x = genre,
  y = rating,
  plot.type = "box",
  outlier.tagging = TRUE,
  outlier.label = title,
  outlier.coef = 2,
  messages = FALSE
)

reprex package(v0.2.1.9000)于2018-10-17创建