我想在R中将数值设置为分位数类别,直到现在我使用
ntile
功能。但我很不确定这个函数如何计算分位数值,就像它也有异常值一样。在获得分位数值时是否还有其他方法可以消除异常值,请告诉我。
答案 0 :(得分:1)
也许您只想知道在运行分位数之前从数据集中删除值的方法?
test <- rnorm(100) # Generate data (assuming you can get an outlier)
bp <- boxplot(test) # box plot is a simple way to identify outliers
outlier <- which(test == bp$out) # get the position of those outliers in your data
quantile(test[-outlier]) # remove them as you use the quantile function