R的IQR异常值

时间:2018-03-03 23:30:40

标签: r

我应该使用1.5 * IQR规则通过在函数中使用这两个方程来确定左右尾部的异常值:

  • Q1-(1.5 * IQR)
  • Q3 +(1.5 * IQR)

这是我到目前为止所尝试的:

IQR.outliers <- function(x) {
  if(any(is.na(x)))
    stop("x is missing values")
  if(!is.numeric(x))
    stop("x is not numeric")
  Q3<-quantile(x,0.75)
  Q1<-quantile(x,0.25)
  IQR<-(Q3-Q1)
  left<-x<(Q1-(1.5*IQR))
  right<-x>(Q3+(1.5*IQR))
  c(left,right)
}

1 个答案:

答案 0 :(得分:2)

目前你正在获得一个逻辑向量。而是使用逻辑索引。假设你只想要价值本身而不是他们的立场,那么:

IQR.outliers <- function(x) {
  if(any(is.na(x)))
    stop("x is missing values")
  if(!is.numeric(x))
    stop("x is not numeric")
  Q3<-quantile(x,0.75)
  Q1<-quantile(x,0.25)
  IQR<-(Q3-Q1)
  left<- (Q1-(1.5*IQR))
  right<- (Q3+(1.5*IQR))
  c(x[x <left],x[x>right])
}

检查它是否给出了明智的结果:

> IQR.outliers (1:100)
integer(0)
> IQR.outliers (c(1:100,1000))
[1] 1000
> IQR.outliers (rnorm(1000) )
[1] -3.522064 -3.296682  2.910200  2.671333