" out"是什么意思? R中的箱形图对象?

时间:2017-04-03 20:24:41

标签: r boxplot

假设这是我的数据集:

ID<- seq(1:50)
mou<-sample(c(2000, 2500, 440, 4990, 23000, 450, 3412, 4958,745,1000), 50, replace= TRUE)
calls<-sample(c(50, 51, 12, 60, 90, 888, 444, 668, 16, 89, 222,33, 243, 239, 333, 645,23, 50,555), 50, replace= TRUE)
rev<- sample(c(100, 345, 758, 44, 58, 334, 50000, 888, 205, 940,298, 754), 50, replace= TRUE)
dt<- data.frame(mou, calls, rev)

我为调用做了箱形图,在分析时,我看到了箱形图的以下对象。

x<-boxplot(dt$calls)
names(x)
> names(x)
[1] "stats" "n"     "conf"  "out"   "group" "names"

查看x $ stats的输出,我发现stats对象给了我较低的胡须,每个组的下铰链,中间,上铰链和上胡须。但我有点困惑的是对象&#34; out&#34;实际意思?这是否表示异常值或其他值? 我的boxplot的out对象给出了以下结果:

> x$out
[1]   555 10000   555   555   555   555   555 10000

2 个答案:

答案 0 :(得分:0)

它为您提供:“超出胡须极端的任何数据点的值”

请查看here以获取更多信息。

请考虑在Data ScienceCross Validated等其他社区提出此类问题。

答案 1 :(得分:0)

x <-boxplot(dt $ calls)。

It(x $ out)提供离群值。删除它们并创建一个新列以获取“完美数据”。

例如:

outliers_values = x $ out

new_data = data [!(数据%in%outliers_values)]