我正在研究农业强度与鸟类功能多样性之间的关系。
在我的GLM模型中,我包括了许多其他变量,包括森林,半自然栖息地,温度,农药等。
在查看变量是否为正态分布时,我使用QQplot来确定正态性,并且似乎存在这三个异常值。
我想知道如何删除这些离群值以使我的数据更正常地分布?
我尝试使用离群值软件包,但是发现的所有示例都无法正常工作,或者我无法理解它们的工作原理!
任何帮助将不胜感激。这是我的功能散布模型的QQ图,以及功能散布x农业强度的散布。 QQ剧情
功能分散x农业分布
答案 0 :(得分:1)
您可以删除不适当显示的观测值。考虑到观测值的数量,这不太可能更改估计值,但是请确保确实如此。另外,在报告工作时,请确保根据您对变量的领域知识来说明为什么删除这些要点。
您可以使用删除观测
model.data.scaled <- model.data.scaled[model.data.scaled$agri > -5, ]