我正在尝试使用监督机器学习算法对数据进行分类。
一切都运行良好,但仅仅为了我的好奇心,我同时尝试了6种分类算法数据集。遵循的步骤如下 -
1> 训练所有算法 2> 通过所有算法单独预测所有test_data的结果( 1或0 。) 3> 如果大多数algos给出 0 ,我认为该数据对的结果为 0 ,结果 1 即可。
4> 然后我发现了整体准确性。
我希望总体准确度高于单个结果(每个算法单独工作),但我几乎达到了平均准确度。(这里的平均值表示单个算法的准确度)。
任何人都可以帮我找到原因吗?
答案 0 :(得分:2)
这取决于您选择的算法。许多算法对不同的东西都很敏感。例如,k-means,线性SVM和功率迭代聚类将得到明显不同的结果。
你得到了你的要求:你平均了选票,没有以任何方式协调算法。你得到了一个平均结果。
我怀疑加权平均会有多大帮助;你所做的就是训练一个元模型。相反,请考虑您拥有的数据集。您需要研究建模算法,并根据所需目的选择一种能够很好地处理数据集统计形状的算法。既然你没有给我们这个背景,我们就无法提供具体细节。