假设这是我的数据集:
ID<- seq(1:50)
mou<-sample(c(2000, 2500, 440, 4990, 23000, 450, 3412, 4958,745,1000), 50, replace= TRUE)
calls<-sample(c(50, 51, 12, 60, 90, 888, 444, 668, 16, 89, 222,33, 243, 239, 333, 645,23, 50,555), 50, replace= TRUE)
rev<- sample(c(100, 345, 758, 44, 58, 334, 50000, 888, 205, 940,298, 754), 50, replace= TRUE)
dt<- data.frame(mou, calls, rev)
我为调用做了箱形图,在分析时,我看到了箱形图的以下对象。
x<-boxplot(dt$calls)
names(x)
> names(x)
[1] "stats" "n" "conf" "out" "group" "names"
查看x $ stats的输出,我发现stats对象给了我较低的胡须,每个组的下铰链,中间,上铰链和上胡须。但我有点困惑的是对象&#34; out&#34;实际意思?这是否表示异常值或其他值? 我的boxplot的out对象给出了以下结果:
> x$out
[1] 555 10000 555 555 555 555 555 10000
答案 0 :(得分:0)
答案 1 :(得分:0)
x <-boxplot(dt $ calls)。
It(x $ out)提供离群值。删除它们并创建一个新列以获取“完美数据”。
例如:
outliers_values = x $ out
new_data = data [!(数据%in%outliers_values)]