所以我基本上有一群学生,让他们完成一个“个性测验”。个性测验基本上由他们根据1-10个等级评定自己的许多不同特征(即内向,专注能力等)。
然后将学生分成小组,并做了几个小组作业。然后我让他们做了另一个测验,他们基本上反映了他们在作业中的表现 - 比如小组聚在一起的情况,他们在作业上的分数,他们有多少分歧,他们能够集中精力等等。以1-10的比例。
我现在有了一组新学生,并让他们完成了我给第一批学生的同样个性测验。
我现在想制作一个机器学习算法,并使用我从第一组学生那里获得的个性和表现数据进行训练。我希望现在能够使用他们的个性测验结果对新学生进行分组,以便最大限度地提高小组的表现。
换句话说,我有一群学生,我在我组成的小组中衡量他们的个性和表现。我现在有了一组新学生,他们希望机器学习算法能够从原始的学生数据集中学习,并将新学生分组,以便他们的个性能够协同工作以最大限度地提高学习成绩。
有人能指出我正确的方向吗?我没有任何机器学习经验,因此不知道该使用什么。
答案 0 :(得分:0)
首先,正如所提到的评论,这是该网站的主题。但我正在回答,因为我想。
现在,您正在进行的整个实验受到一些可能存在问题的偏见。我没有提出参考,因为我愿意花时间(你应该找到自己的参考资料):
现在您还没有定义以下内容:
通常,您可以使用大多数模型对数据集进行N交叉折叠。在您的情况下,很可能是优化度量的优化问题,根据群体表现的组合计算,对学生的所有可能划分。如果你没有设计一个贪婪的算法,它将是计算上昂贵的并且根本不可扩展。
我会把你留在这里。现在是时候做一些工作了。