多个箱图,在异常值上有名称

时间:2012-12-22 23:36:35

标签: r boxplot outliers

我有一个像这样的箱子图:

Boxplot( ~ km_piste, data=slide, id.method="y", col="orange")

enter image description here

显示异常值名称是因为我将第一列设置为:

row.names(slide) <- as.character(slide$data_name)

现在我想知道如何制作一个新的多箱图。 我想在同一张图片上有2个盒子图。 数据仍在幻灯片数据库中。 2列的名称是:

  1. ski_parc(slide $ ski_parc)
  2. snow_parc(slide $ snow_parc)
  3. 我无法弄清楚如何将2箱图放在同一张图片上并显示:

    • 每个2 boxplot
    • 的打印屏幕上的异常值名称
    • 每个箱图下方的箱图名称,以便识别它们

    编辑:这是我的数据库slide

    的链接

1 个答案:

答案 0 :(得分:2)

car :: Boxplot的第二个参数是'g',用作分组变量。目前我们无法分辨出你的数据帧是什么样子,听起来好像它可能不是Boxplot期望的长格式。如果有一列说“area_type”的值为“ski_parc”和“snow_parc”,则可以使用以下格式:

Boxplot( ~ km_piste, g= area_type, data=slide, id.method="y", col=c("orange", "red") )

使用na.omit与点的标记无关。这是使用id.method="y"的选择。当有多个组时,x轴会标记其级别。

试试这个:

snow_parc <- data.frame(parc =c(slides$snow_parc, slides$ski_parc), 
              type=rep(c("snow_parc", "ski_parc"), each=40))
Boxplot(parc~type, data=snow_parc, id.method = "y")

(没有异常值。)