我想学习预测未来事件,比如......能够使用过去二十年的飞机失事数据预测2018年飞机失事的数量.....或.....预测有多少Justin beibers面对它的T恤将在2018年出售,取决于粉丝基础上的previuos数据..........或者如果他们决定推出多少iphone 8和samsungs s9将被出售确切的日期....预测有点准确的整个销售市场.....这样的东西....请建议一本书...我真的很喜欢头第一系列....是否适合我的头数据分析? ....我不知道如果我可以提出除了编程之外的问题或者不是.....但我在这里.....顺便说一下,大数据与此有什么关系吗?
答案 0 :(得分:0)
这一切都属于数据科学(大数据和数据分析)。您对预测和此类内容所需的是对您拥有或可以访问您想要预测的内容的数据的一些机器学习方法。
我推荐这一系列最新文章:https://medium.com/machine-learning-for-humans/why-machine-learning-matters-6164faf1df12
除了非常好的介绍外,您还可以找到很多资源,可以在那里进一步学习。
另外,我强烈推荐斯坦福大学的deeplearning.ai和机器学习课程,你可以在Coursera找到。
干杯!
答案 1 :(得分:0)
我认为您提出的大多数情景都是监督学习的情况,这是一种机器学习,其中您有先前的数据来训练您的机器学习模型的输入和输出值,并且一旦您训练了您输入新输入值的模型,它会为您提供预测输出。
我强烈推荐Andrew NG的以下机器学习课程,其中课程涵盖ML的所有基础知识,包括监督和无监督学习。
https://www.coursera.org/learn/machine-learning
至于书籍,来自Analytics Vidya的以下链接是一个很好的起点,您可以阅读这些书籍,因为它们可以为您提供一些良好的统计和数据科学基础知识。
至于数据科学,数据分析和大数据之间的差异。数据科学和数据分析在某种意义上是相似的,它们都试图在数据中找到模式,并根据这些模式得出一些见解。
另一方面,大数据基本上是分布在多台机器上的巨大数据,因此您可以同时并行地存储和计算大量数据。
所以你可能会问大数据和机器学习有什么关系?答案在于机器学习模型的训练,因为预测的准确性在一定程度上取决于你训练它的数据量。因此更多的训练数据更好地预测和数据大数据方式领先于其他人,因此关系。