如何从箱线图中将正负异常值提取到R中的单独变量中?

时间:2014-05-02 13:24:39

标签: r boxplot outliers

我需要将箱线图中的异常值绘制到地图上。我的讲师给了我从this boxplot中提取所有异常值的功能:

  

outliers = match(名称(boxplot(pc3,plot = FALSE)$ out),名称(pc3))

(pc3是数据)

我正在使用以下方式绘制它们:

  

点(Data.1 $ X [outliers],Data.1 $ Y [outliers],col =“red”,cex = 3,lwd = 2)

然而,我想将正异常值提取到一个变量中,将负异常值提取到一个不同的变量中,以便用不同的颜色绘制它们。我该怎么做?

谢谢。

1 个答案:

答案 0 :(得分:1)

异常值由boxplot定义为距离方框四边形(第75和第25百分位数)的四分位数范围的1.5倍。您可以直接应用该定义:

iq.range <- quantile(pc3, probs=c(0.25, 0.75))
lower.bound <- iq.range[1] - 1.5*diff(iq.range)
upper.bound <- iq.range[2] + 1.5*diff(iq.range)

low.out <- pc3[pc3 < lower.bound]
high.out <- pc3[pc3 > upper.bound]

从头开始计算它。您还可以使用中位数来分割从boxplot获得的向量。以上任何事情都是较高的部分。