移除扭曲数据的异常值

时间:2019-08-20 10:50:16

标签: r ggplot2 dplyr normalization denormalization

我正在研究农业强度与鸟类功能多样性之间的关系。

在我的GLM模型中,我包括了许多其他变量,包括森林,半自然栖息地,温度,农药等。

在查看变量是否为正态分布时,我使用QQplot来确定正态性,并且似乎存在这三个异常值。

我想知道如何删除这些离群值以使我的数据更正常地分布?

我尝试使用离群值软件包,但是发现的所有示例都无法正常工作,或者我无法理解它们的工作原理!

任何帮助将不胜感激。这是我的功能散布模型的QQ图,以及功能散布x农业强度的散布。 QQ剧情

QQ plot

功能分散x农业分布

functional dispersion x agriculture scatter

1 个答案:

答案 0 :(得分:1)

您可以删除不适当显示的观测值。考虑到观测值的数量,这不太可能更改估计值,但是请确保确实如此。另外,在报告工作时,请确保根据您对变量的领域知识来说明为什么删除这些要点。

您可以使用删除观测

model.data.scaled <- model.data.scaled[model.data.scaled$agri > -5, ]