在R

时间:2016-10-18 14:06:38

标签: r

我发现这个脚本用于识别和删除数据中的异常值。该代码允许您选择是否要删除检测到的异常值。这是代码的链接和它的文章:

https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/

我想要做的不是删除异常值,而是复制它们并使用它们创建不同的数据集。例如,如果我有一个100 000条记录的数据集,并且我有这个脚本检测到3500个异常值,我想获取这3500条记录并创建一个只包含它们的整个数据集,以便我以后可以对它们进行额外的分析。我不想将它们从原始数据集中删除。

有办法吗?谢谢!

实施例

var1   var2   
a      15     
b      1
c      2
d      1
e      3

然后算法识别第1行

var1    var2
a       15

是异常值并显示某种类型的东西:

检测到异常值:1 百分比:20%

依此类推。但是,该脚本不会为我提供仅包含异常值的单独数据集。我怎么做?请?

1 个答案:

答案 0 :(得分:1)

您可以使用以下内容获取异常值:boxplot.stats(x)$out