此分析问题需要帮助:
在州各学区和学校中抽取了通识教育学生的考试成绩。还收集了班级大小(伪编码变量,指示较小到非常大的班级大小)。确定班级规模对通识教育成绩的影响。确保执行分析并提供完整的摘要。
我尝试使用lmer,但认为数据不是均衡的设计,有人可以通过R studio来建议我吗?
我检查了教育成绩的偏度,并通过对数(educationscore + 0.2)解决了偏度
数据集是一个excel文件,我无法上传,因此我必须在此处发布文件链接。
https://drive.google.com/open?id=1_ovhvrrFVNV2gP8c5vrg1FZ8C9x9NqCT
答案 0 :(得分:0)
如果不满足线性模型条件,并不表示模型无法预测,仅表示p值可能是错误的。
只需在火车上分开进行测试,并检查测试组的预测是否正确。