我知道有类似的问题/答案和很多论文。但请读到最后。
非统计学家倾向于使用逐步回归,统计学家强烈反对这种回归。这是我不明白的东西,但我只是服从他们。 “好的,这不是进行建模的好方法。”
这里是(是)我的模特:
b <- lmer(metric1~a+b+c+d+e+f+g+h+i+j+k+l+(1|X/Y) + (1|Z), data = dataset)
drop1 (b, test="Chisq")
(只是一个小小的注释:注意模型中的随机效果;随机效果是年,月,采样。位置;我的一个变量是1/0:我已经对变量进行了对数转换)
我正在尝试找到一个探索性模型(使用drop1
来达到最终模型)并使用我的生物学知识对其进行评估,看看是否依赖(在这种情况下,“度量”)似乎是响应变量。我将用100个指标重复这个过程,只是为了评估哪些指标似乎是响应环境变量。
根据统计专家的建议,我正在寻找一个可接受的模型,而不是逐步的。
然而,有很多选择。我读了很多,但仍然觉得自己迷了路。有人说Lasso,有人说弹性模型,有人说脊回归......哪一个适合我的目的?
任何有关更好的替代方案的建议,以及简单的模型或傻瓜的帮助页面或示例(可能更好)都将非常感激。
提前致谢。