应用错误收集

时间：2017-03-28 13:54:46

标签： machine-learning classification supervised-learning

我正在尝试使用监督机器学习算法对数据进行分类。

一切都运行良好，但仅仅为了我的好奇心，我同时尝试了6种分类算法数据集。遵循的步骤如下 -

1＆gt; 训练所有算法    2＆gt; 通过所有算法单独预测所有test_data的结果（ 1或0 。）    3＆gt; 如果大多数algos给出 0 ，我认为该数据对的结果为 0 ，结果 1 即可。
   4＆gt; 然后我发现了整体准确性。

我希望总体准确度高于单个结果（每个算法单独工作），但我几乎达到了平均准确度。（这里的平均值表示单个算法的准确度）。

任何人都可以帮我找到原因吗？

答案 0 :(得分：2)

这取决于您选择的算法。许多算法对不同的东西都很敏感。例如，k-means，线性SVM和功率迭代聚类将得到明显不同的结果。

你得到了你的要求：你平均了选票，没有以任何方式协调算法。你得到了一个平均结果。

我怀疑加权平均会有多大帮助;你所做的就是训练一个元模型。相反，请考虑您拥有的数据集。您需要研究建模算法，并根据所需目的选择一种能够很好地处理数据集统计形状的算法。既然你没有给我们这个背景，我们就无法提供具体细节。