如何识别QQplot中的数据点

时间:2018-03-29 03:44:41

标签: r graph normal-distribution

我正在分析剩余的QQ图,以评估它们是否可以被假定为正态分布,并且我有一些远离理论直线的数据点。我的问题是:有什么方法可以让R来确定那些具体点,所以我可以学习并尝试更好地理解它们吗? 的谢谢!

enter image description here

1 个答案:

答案 0 :(得分:1)

您可以使用情节来执行魔法。首先生成一个QQ情节:

> set.seed(1234)
> x <- rexp(100,100)
> qqpoints <- qqnorm(x)

现在使用identify来帮助你调出边缘上的点。输入此行并按确认键:

> identify(results)

转到图表,然后单击其中一个异常值。然后点击ESCAPE。对于你想要呼叫的每个点,请做几次。

> identify(qqpoints)
[1] 37
> identify(qqpoints)
[1] 60
> identify(qqpoints)
[1] 27
> identify(qqpoints)
[1] 75

弹出的每个数字都是您想要了解的点的索引。您可以像这样获得它们的单独坐标:

> qqpoints$x[37]
[1] 2.575829
> qqpoints$y[37]
[1] 0.04324563

分布中点的实际值如下:

> x[37]
[1] 0.04324563

标签将出现在情节中:

qqpoints

如果你不知道哪些是异常值并且你需要先弄明白,请使用qqPlot包中的car 然后 identify以图形方式超出置信区间的点数:

> library(car)
> qqPlot(x)

qqPlot