假设有一所学校设有100个不同的班级,组成如下:
班级,没有学生,参加了科目
1、10,数学,物理,化学
1、20,计算机科学,数学
1、5,生物学,英语
2、5,数学,物理,化学
2、10,生物学,英语
3、8,数学,物理,化学
3、5,生物学,英语
...等等
如何为任何随机类别的成分做出任何预测?例如,根据前7行数据,我可以说每个班级至少有5名学生学习数学,物理,化学,至少有5名学生学习生物学,英语。
是否有可能建立一个可以为任何随机类别提供此预测的模型?如果有100个类别(样本大小),则该模型需要进行多少个类别的数据预测?理想情况下,我希望该模型为类提供以下预测:
学生人数,所修科目,置信度,误差幅度
如何建立此模式?使用线性回归还是其他?
非常感谢您的帮助。