应用错误收集

所以我基本上有一群学生，让他们完成一个“个性测验”。个性测验基本上由他们根据1-10个等级评定自己的许多不同特征（即内向，专注能力等）。

然后将学生分成小组，并做了几个小组作业。然后我让他们做了另一个测验，他们基本上反映了他们在作业中的表现 - 比如小组聚在一起的情况，他们在作业上的分数，他们有多少分歧，他们能够集中精力等等。以1-10的比例。

我现在有了一组新学生，并让他们完成了我给第一批学生的同样个性测验。

我现在想制作一个机器学习算法，并使用我从第一组学生那里获得的个性和表现数据进行训练。我希望现在能够使用他们的个性测验结果对新学生进行分组，以便最大限度地提高小组的表现。

换句话说，我有一群学生，我在我组成的小组中衡量他们的个性和表现。我现在有了一组新学生，他们希望机器学习算法能够从原始的学生数据集中学习，并将新学生分组，以便他们的个性能够协同工作以最大限度地提高学习成绩。

有人能指出我正确的方向吗？我没有任何机器学习经验，因此不知道该使用什么。

首先，正如所提到的评论，这是该网站的主题。但我正在回答，因为我想。

现在，您正在进行的整个实验受到一些可能存在问题的偏见。我没有提出参考，因为我愿意花时间（你应该找到自己的参考资料）：

现在您还没有定义以下内容：

通常，您可以使用大多数模型对数据集进行N交叉折叠。在您的情况下，很可能是优化度量的优化问题，根据群体表现的组合计算，对学生的所有可能划分。如果你没有设计一个贪婪的算法，它将是计算上昂贵的并且根本不可扩展。

我会把你留在这里。现在是时候做一些工作了。