为什么机器学习算法关注速度而不是准确性?

时间:2020-02-11 15:05:11

标签: tensorflow machine-learning

我研究了ML,发现大多数时候算法的重点是运行时间而不是准确性。减少特征,从数据集中获取样本,使用近似等。

我不确定为什么要关注它,因为一旦我训练了我的模型,如果我的精度足够高,就不需要再对其进行训练了,为此,如果我需要1个小时或10天的时间来训练我的模型,就不会真的之所以重要,是因为我只做过1次,而我的目标是尽可能地预测我的结果(最小的损失)。

如果我训练的模型在猫和狗之间有所不同,我希望它是最准确的,而不是禁食,因为一旦我训练了该模型,就不需要再训练任何模型了。 我能理解为什么依赖于快速变化的数据的模型需要这种速度的关注,但是对于一般的训练模型,我却不明白为什么关注速度的原因。

1 个答案:

答案 0 :(得分:1)

速度是相对项。精度也是相对的,取决于任务的难度。当前的目标是以合理的成本获得类似于人类的应用性能,因为这将代替人工并削减成本。

根据我在阅读论文中所看到的,人们通常首先关注准确性以产生有用的东西。然后进行消融研究-研究其中的模型部分被删除或修改的情况-以更少的时间或更少的内存需求实现相同的性能。

该领域经过实验验证。实际上,没有什么理论可以说明CNN为何能如此出色地工作,除了可以对给定非线性激活函数的任何函数进行建模之外。 (https://en.wikipedia.org/wiki/Universal_approximation_theorem)最近进行了一些努力来解释为什么它能很好地工作。我记得一个是MobileNetV2:反向残差和线性瓶颈。 将数据嵌入到低维空间而不丢失信息的解释可能值得一读。