不平衡数据的多元回归

时间:2019-07-13 22:07:07

标签: r

此分析问题需要帮助:

在州各学区和学校中抽取了通识教育学生的考试成绩。还收集了班级大小(伪编码变量,指示较小到非常大的班级大小)。确定班级规模对通识教育成绩的影响。确保执行分析并提供完整的摘要。

我尝试使用lmer,但认为数据不是均衡的设计,有人可以通过R studio来建议我吗?

我检查了教育成绩的偏度,并通过对数(educationscore + 0.2)解决了偏度

数据集是一个excel文件,我无法上传,因此我必须在此处发布文件链接。

https://drive.google.com/open?id=1_ovhvrrFVNV2gP8c5vrg1FZ8C9x9NqCT

1 个答案:

答案 0 :(得分:0)

如果不满足线性模型条件,并不表示模型无法预测,仅表示p值可能是错误的。

只需在火车上分开进行测试,并检查测试组的预测是否正确。