我正在分析this kaggle数据集中的数据。我正在尝试分析吸烟者的bmi对医疗费用的影响,但是我也想将分层模型与考虑的不同区域的聚类效果进行拟合。请注意,我正在分析吸烟者群体,因此请将数据过滤到吸烟者群体。
ggplot(insurance_smoker, aes(x=bmi,y=charges, colour=region))+
geom_point()+
geom_smooth(method=lm, se=FALSE)
上面的代码使我可以看到不同区域之间的线性回归线是什么样的。它们看起来相似,但绝对不相同,因此我期望使用lmer的分层模型可以为我带来一些好处。然后,我在下面尝试拟合2个模型,其中bmi作为固定效果的model1,随机截距的区域。并将bmi作为固定效果的model2和具有随机斜率和截距的区域。但是两个模型都给我“边界(奇异)拟合:请参阅?isSingular”警告。
model1 = lmer(charges~ bmi + (1|region), data = insurance_smoker)
model2 = lmer(charges~ bmi + (1 + bmi|region), data = insurance_smoker)
我的问题是:模型是否正确?我假设来自区域的随机效应是如此之小,以至于接近0,但是如何用代码和曲线图来解释呢?从上面的ggplot中,我当然可以看到不同之处。我什至尝试记录变换电荷和bmi,但仍然给我一个奇异的感觉。