机器学习和统计之间的区别是什么?

时间:2010-11-17 14:01:36

标签: statistics machine-learning

Turing lecture 2010 Christopher Bishop讨论机器学习正在经历革命,因为统计数据正在应用于机器学习算法......

但是它像所有的机器学习算法都是统计算法。两者之间真正的区别是什么?为什么他们在大多数大学分开课程?

9 个答案:

答案 0 :(得分:10)

统计数据基于概率模型。典型的分析首先假设您的数据是来自具有某种分布的随机变量的样本,然后对分布的参数进行推断。

机器学习可能使用概率模型,当它出现时,它会与统计数据重叠。但机器学习并非如此致力于概率。它也愿意使用其他不基于概率的问题解决方法。

答案 1 :(得分:9)

两者之间没有太大差异,而且主要是文化差异。机器学习来自计算机科学的根源而统计学则更具数学性。 Brendan O'Connor写了一篇名为"Statistics vs. Machine Learning, fight!"的好文章,讨论了这个问题。

对于机器学习的非统计方法,有几种基于规则的方法(决策树,规则归纳,ILP),还有一些方法,如控制问题的强化学习。对我来说,那些感觉非常统计,但你可以声称他们是......如果你愿意的话,你可能会声称所有生命都属于统计决策理论(事实上,{{3确实)。

答案 2 :(得分:1)

我可以看到一些重要的差异:

#Scope :机器学习使用统计模型,但它也使用其他模型,如动态编程,强化学习,来自人工智能或优化的技术。

#Point of View :统计数据通常与估算器的属性(无偏见,渐近行为)有关,机器学习主要关注现实世界问题的解决方案。

#Reasearch field :虽然统计学可以看作是应用数学的一个子领域,但机器学习可以看作是计算机科学的一个子领域。

#Code开发和应用:虽然使用统计数据的人通常都有R(或SAS,STATA,EVIEWS)的预设,但使用机器学习的人通常会选择Python(或其他结构化的)编程语言)

答案 3 :(得分:1)

机器学习:

机器学习是使计算机通过提供数据和信息而无需明确编程就可以像人一样学习和行动的科学。

示例: 当我们来到计算机上时,编写和平的代码或程序,并逐步告诉计算机要执行的操作。但是ML我们不这样做,系统会自行学习。我们只提供过去的数据(称为标记数据),系统就会在此过程中学习所谓的训练过程,我们告诉系统系统结果是对还是错,反馈是由系统接受的,并且它会纠正自己,这就是从谁那里学到的知识,它就可以给出大多数案例的正确输出。显然,这不是100%正确的,但目标是尽可能地准确。

统计数据:

这是一个数学领域,用于查找不同变量之间的关系。

主要区别:

统计:专注于以数学方程的形式形式化变量之间的关系。

机器学习:包含可以从数据中学习而无需依赖基于规则的编程的算法。

答案 4 :(得分:0)

也许值得指出的是,CrossValidated

正在讨论和讨论类似的问题

答案 5 :(得分:0)

统计数据侧重于数据分析的所有方面,如描述性,探索性,推理性,预测性和因果性。但是,机器学习只关注预测建模。

答案 6 :(得分:0)

机器学习

  • 一种可以在不依赖基于规则的编程的情况下从数据中学习的算法。

  • 计算机科学和人工智能的一个子领域,负责处理可以从数据中学习的构建系统,而不是明确编程的指令。

统计建模

  • 以数学方程的形式形式化变量之间的关系。

  • 数学子领域,用于寻找变量之间的关系以预测结果

机器学习系统是一个真正的学习系统,如果它没有被编程为执行任务,而是被编程为学习执行任务。这是一项数据驱动的练习。现代机器学习不依赖于丰富的算法技术。这种形式的机器学习的几乎所有应用都基于深度神经网络。这是我们现在倾向于称之为深度学习的领域,这是机器学习的专业化,并且经常应用于弱人工智能应用程序,其中机器执行人工任务。

答案 7 :(得分:0)

在ML中,我们的想法是针对有数据与没有数据的情况建立一个单独的模型。

另一方面,统计信息是关于保留您拥有的数据并获得最佳数据结果。

不同之处在于哲学会影响您对待异常值的方式。 在ML中,您外出并找到足够的离群值,可以实际使用这些离群值。

在统计信息中,您说:“我拥有了我将能够收集的所有数据。”因此,您排除了异常值。由于使用ML和统计信息的场景,这是哲学上的差异。

统计信息通常用于有限的数据机制中,或者ML会处理大量数据。

答案 8 :(得分:0)

机器学习是由计算机科学家开发的,而统计学是由数学家开发的。 机器学习建立在统计框架上。 统计学是在17世纪发展起来的,机器学习是在1959年发展起来的。 机器学习是人工智能的一个子领域。统计是数学的一个子领域。 机器学习找到可概括的预测模式,而统计数据则从样本中得出总体推断。 机器学习是一种BlackBox方法。统计信息将打开BlackBox。 机器学习需要大量的数据和属性,而统计需要的则更少。 统计需要数学知识。机器学习需要数学和算法知识。 统计数据使用数据点之间的相关性,而机器学习用于做出假设。 ML做出的假设少于统计数据。 机器学习具有更大的预测能力。 与统计相比,机器学习所需的人力更少。 机器学习使用算法。统计使用方程式。 他们使用不同的工具

您可以在我发现的这篇文章中找到更多信息:https://www.thejay.tech/2020/01/the-actual-difference-between.html