机器学习建议

时间:2015-11-18 18:31:04

标签: azure-machine-learning-studio

我有很多学生根据他们的分数被一些大学选中的数据。我刚接触机器学习。我是否可以提供一些建议如何添加Azure机器学习以根据标记预测他们可以获得的大学

8 个答案:

答案 0 :(得分:7)

答案 1 :(得分:4)

除了逻辑回归,正如@neerajkh建议的那样,我也会尝试 One vs All classifiers。这种方法用于在多类问题中很好地工作(我假设你有许多输入,这是学生的标记)和许多输出(不同的学院)。

要实现一个与所有算法,我会使用Support Vector Machines(SVM)。它是最强大的算法之一(直到深度学习进入现场,但你不需要深入学习)

如果您可以考虑更改框架,我建议使用python库。在python中,非常快速地计算你所面临的问题。

答案 2 :(得分:1)

使用randomforesttrees并将此ML算法提供给OneVsRestClassifer,这是一个多类分类器

答案 3 :(得分:0)

与其他海报保持一致'使用多类分类的建议,你可以使用人工神经网络(ANNs)/多层感知器来做到这一点。每个输出节点都可以是大学,因为你将使用sigmoid传递函数(逻辑),每个节点的输出可以直接被视为该大学接受特定学生的概率(当试图做出预测时)。

答案 4 :(得分:0)

你为什么不尝试softmax回归?

用非常简单的术语来说,Softmax接受输入并产生属于每个类的输入的概率分布。因此换句话说,基于某些输入(在这种情况下为等级),您的模型可以输出概率分布,该概率分布代表每个学院必须接受给定学生的“机会”。

答案 5 :(得分:0)

我知道这是一个老线程,但我会继续加上我的2美分。

我建议添加多类,多标签分类器。这允许您为学生找到多个学院。当然,使用人工神经网络要容易得多,但配置起来要困难得多(比如网络的配置;节点/隐藏节点的数量,甚至是激活功能)。

执行此操作的最简单方法是@Hoap Humanoid建议使用支持向量分类器。

要执行这些方法中的任何一种方法,您必须拥有完善的数据集。我不能说你需要试验的数据点的数量,但模型的准确性取决于数据点的数量及其多样性。

答案 6 :(得分:0)

这是非常主观的。只应用任何分类的算法都不是一个好主意。如果不执行探索性数据分析并检查以下内容,除了缺少值之外,您无法确定是否正在进行预测分析:

  
      
  1. 定量和定性变量。
  2.   
  3. 单变量,双变量和多变量分布。
  4.   
  5. 与您的回复(大学)变量的可变关系。
  6.   
  7. 寻找异常值(多变量和单变量)。
  8.   
  9. 必需的变量转换。
  10.   
  11. 可以将Y变量分解为例如位置的块,例如候选人是否可以成为加州大学或纽约大学的一部分。如果加州有更高的机会,那么什么大学。通过这种方式,您可以捕获线性+非线性关系。
  12.   

对于基础学习者,您可以使用Softmax回归模型或1对所有Logistic回归,这对于非线性关系而言并不重要,CART也非常重要。我还会做K-nn和K-means来检查数据中的不同组并决定预测学习者。

我希望这是有道理的!

答案 7 :(得分:0)

最小二乘支持向量机(LSSVM)是此应用程序的强大算法。请访问http://www.esat.kuleuven.be/sista/lssvmlab/了解详情。