我正在使用mgcv软件包编写GAM,该软件包使用实地考察期间获得的数据和从Sentinel卫星拍摄的图像来预测岛上两种不同物种的洞穴丰度和分布。共调查了101个地块。在66个样地中记录了922个属于物种1的洞穴,在8个样地中记录了属于物种2的29个洞穴。
我对物种1使用负二项式分布,因为使用泊松分布导致模型过度分散。最大模型是:
gam(Species_1 ~ s(x, y, bs="ts") +
Sentinel2_band_1 + Sentinel2_band_2 + Sentinel2_band_3 + Sentinel2_band_4 + Sentinel2_band_5 +
Sentinel2_band_6 + Sentinel2_band_7 + Sentinel2_band_8 + Sentinel2_band_9 + Sentinel2_band_10 +
I(Sentinel2_band_1^2) + I(Sentinel2_band_2^2) + I(Sentinel2_band_3^2) + I(Sentinel2_band_4^2) + I(Sentinel2_band_5^2) +
I(Sentinel2_band_6^2) + I(Sentinel2_band_7^2) + I(Sentinel2_band_8^2) + I(Sentinel2_band_9^2) + I(Sentinel2_band_10^2) +
aspect + elevation + slope +
I(aspect^2) + I(elevation^2) + I(slope^2) +
aspect:elevation + aspect:slope + elevation:slope,
data = dat,
family = nb(1))
模型选择过程产生的模型给出了可接受的结果。
当我使用种类2作为响应变量运行相同的模型时,出现以下错误消息:
Warning message:
In newton(lsp = lsp, X = G$X, y = G$y, Eb = G$Eb, UrS = G$UrS, L = G$L, :
Fitting terminated with step failure - check results carefully
诊断图看起来也很狡猾:
我认为我遇到的问题是由于物种2的样本量小得多。
有什么想法可以解决这个问题吗?