应用错误收集

机器学习建议

时间：2015-11-18 18:31:04

标签： azure-machine-learning-studio

我有很多学生根据他们的分数被一些大学选中的数据。我刚接触机器学习。我是否可以提供一些建议如何添加Azure机器学习以根据标记预测他们可以获得的大学

8 个答案:

答案 0 :(得分：7)

尝试多级逻辑回归 - 同时查看此https://gallery.cortanaanalytics.com/Experiment/da44bcd5dc2d4e059ebbaf94527d3d5b?fromlegacydomain=1

答案 1 :(得分：4)

除了逻辑回归，正如@neerajkh建议的那样，我也会尝试 One vs All classifiers。这种方法用于在多类问题中很好地工作（我假设你有许多输入，这是学生的标记）和许多输出（不同的学院）。

要实现一个与所有算法，我会使用Support Vector Machines（SVM）。它是最强大的算法之一（直到深度学习进入现场，但你不需要深入学习）

如果您可以考虑更改框架，我建议使用python库。在python中，非常快速地计算你所面临的问题。

答案 2 :(得分：1)

使用randomforesttrees并将此ML算法提供给OneVsRestClassifer，这是一个多类分类器

答案 3 :(得分：0)

与其他海报保持一致＆＃39;使用多类分类的建议，你可以使用人工神经网络（ANNs）/多层感知器来做到这一点。每个输出节点都可以是大学，因为你将使用sigmoid传递函数（逻辑），每个节点的输出可以直接被视为该大学接受特定学生的概率（当试图做出预测时）。

答案 4 :(得分：0)

你为什么不尝试softmax回归？

用非常简单的术语来说，Softmax接受输入并产生属于每个类的输入的概率分布。因此换句话说，基于某些输入（在这种情况下为等级），您的模型可以输出概率分布，该概率分布代表每个学院必须接受给定学生的“机会”。

答案 5 :(得分：0)

我知道这是一个老线程，但我会继续加上我的2美分。

我建议添加多类，多标签分类器。这允许您为学生找到多个学院。当然，使用人工神经网络要容易得多，但配置起来要困难得多（比如网络的配置;节点/隐藏节点的数量，甚至是激活功能）。

执行此操作的最简单方法是@Hoap Humanoid建议使用支持向量分类器。

要执行这些方法中的任何一种方法，您必须拥有完善的数据集。我不能说你需要试验的数据点的数量，但模型的准确性取决于数据点的数量及其多样性。

答案 6 :(得分：0)

这是非常主观的。只应用任何分类的算法都不是一个好主意。如果不执行探索性数据分析并检查以下内容，除了缺少值之外，您无法确定是否正在进行预测分析：

定量和定性变量。

单变量，双变量和多变量分布。

与您的回复（大学）变量的可变关系。

寻找异常值（多变量和单变量）。

必需的变量转换。

可以将Y变量分解为例如位置的块，例如候选人是否可以成为加州大学或纽约大学的一部分。如果加州有更高的机会，那么什么大学。通过这种方式，您可以捕获线性+非线性关系。

对于基础学习者，您可以使用Softmax回归模型或1对所有Logistic回归，这对于非线性关系而言并不重要，CART也非常重要。我还会做K-nn和K-means来检查数据中的不同组并决定预测学习者。

我希望这是有道理的！

答案 7 :(得分：0)

最小二乘支持向量机（LSSVM）是此应用程序的强大算法。请访问http://www.esat.kuleuven.be/sista/lssvmlab/了解详情。