我发现这个脚本用于识别和删除数据中的异常值。该代码允许您选择是否要删除检测到的异常值。这是代码的链接和它的文章:
https://www.r-bloggers.com/identify-describe-plot-and-remove-the-outliers-from-the-dataset/
我想要做的不是删除异常值,而是复制它们并使用它们创建不同的数据集。例如,如果我有一个100 000条记录的数据集,并且我有这个脚本检测到3500个异常值,我想获取这3500条记录并创建一个只包含它们的整个数据集,以便我以后可以对它们进行额外的分析。我不想将它们从原始数据集中删除。
有办法吗?谢谢!
实施例
var1 var2
a 15
b 1
c 2
d 1
e 3
然后算法识别第1行
var1 var2
a 15
是异常值并显示某种类型的东西:
检测到异常值:1 百分比:20%
依此类推。但是,该脚本不会为我提供仅包含异常值的单独数据集。我怎么做?请?
答案 0 :(得分:1)
您可以使用以下内容获取异常值:boxplot.stats(x)$out