什么算法可以解决这个问题?

时间:2015-12-04 22:26:53

标签: algorithm machine-learning artificial-intelligence bigdata

所以我基本上有一群学生,让他们完成一个“个性测验”。个性测验基本上由他们根据1-10个等级评定自己的许多不同特征(即内向,专注能力等)。

然后将学生分成小组,并做了几个小组作业。然后我让他们做了另一个测验,他们基本上反映了他们在作业中的表现 - 比如小组聚在一起的情况,他们在作业上的分数,他们有多少分歧,他们能够集中精力等等。以1-10的比例。

我现在有了一组新学生,并让他们完成了我给第一批学生的同样个性测验。

我现在想制作一个机器学习算法,并使用我从第一组学生那里获得的个性和表现数据进行训练。我希望现在能够使用他们的个性测验结果对新学生进行分组,以便最大限度地提高小组的表现。

换句话说,我有一群学生,我在我组成的小组中衡量他们的个性和表现。我现在有了一组新学生,他们希望机器学习算法能够从原始的学生数据集中学习,并将新学生分组,以便他们的个性能够协同工作以最大限度地提高学习成绩。

有人能指出我正确的方向吗?我没有任何机器学习经验,因此不知道该使用什么。

1 个答案:

答案 0 :(得分:0)

首先,正如所提到的评论,这是该网站的主题。但我正在回答,因为我想。

现在,您正在进行的整个实验受到一些可能存在问题的偏见。我没有提出参考,因为我愿意花时间(你应该找到自己的参考资料):

  1. 人们更乐观地评价与团体相关的表现
  2. 自我形成的群体有时会影响绩效的内在社会关系
  3. 工作的自我访问可能与全局产出评估无关
  4. 不同的任务(您的案例中的类)需要不同类型的协作。因此,如果算法适用,那么您的算法很可能只适用于一个类。
  5. 现在您还没有定义以下内容:

    1. 每组的绩效指标
    2. 在一组小组中培训模型的良好度量
    3. 团体规模(制服或变体)
    4. 组数(预先指定的数字或变体)
    5. 通常,您可以使用大多数模型对数据集进行N交叉折叠。在您的情况下,很可能是优化度量的优化问题,根据群体表现的组合计算,对学生的所有可能划分。如果你没有设计一个贪婪的算法,它将是计算上昂贵的并且根本不可扩展。

      我会把你留在这里。现在是时候做一些工作了。