测试无监督机器学习算法

时间:2017-03-07 02:39:36

标签: testing machine-learning

在整个互联网上,我可以看到有监督和无监督的机器学习算法的应用,但没有人在谈论保持机器学习应用的质量。 最近关于如何测试无监督机器学习算法的分析提出了这些要点:

1)交叉验证测试:数据集分为相等的折叠(部分)和所有折叠,除了一个用作训练数据集,后来用作测试数据集

几乎没有多少选择使用测试和训练数据集。
有没有更有效的方法来测试输出不确定的无监督ML算法?

1 个答案:

答案 0 :(得分:0)

根据您使用的算法类型(以及选择的距离),您仍然可以尝试查看组内的差异和组内的差异是否发生了很大变化。

如果您的算法仍然与构建算法时一样好,那么它们之间的差异和方差之间的差异不会发生太大变化。如果收缩(或反向)之间的差异,则意味着您的算法不能像以前那样将组分开。

你可以尝试的第二件事是保留一些观察结果(你知道它们被很好地分类),以便在重新训练你的算法后看看它们是否仍在同一组中。如果没有,这并不意味着您的算法是错误的,但在这种情况下您可以发送警报以更深入地查看。