所以我们很多人都在谈论大数据问题。我知道一些应用程序,如页面排名,k-means和其他机器学习算法以及Web索引等。
是否有人知道任何其他类型的大数据应用程序。
答案 0 :(得分:6)
这是一个集体智慧的时代。每天,我们创建大约2.5个五分之一字节的数据。据估计,目前世界上90%的数据仅在过去两年内创建。这是我们生成数据的速度!这些数据的新来源日益堆积。
这些来自我们每个人的在线足迹的数据每天都会丢失很多次,用于收集气候信息的各种传感器,我们在社交媒体网站上的帖子,我们的数字图片和视频,短信,在线销售/购买交易记录,手机GPS信号,以及为数百万手机提供的每日新闻文章,仅举几例。这些数据是Bigdata。
但如果我们用纯技术术语说话:
当难以存储,搜索,分析,分享等等时 使用我们传统的数据库管理工具给定数据量, 大型复杂数据集被称为Bigdata。
业界很快意识到数据挖掘的潜力。因此,分别处理或分析组合的大数据集而不是各种较小的数据集必然会提供更多的见解/趋势/模式。例如,对于出租车代理商的出租车预订的历史数据,可以预测很可能在城市的哪个位置,哪种类型的出租车以及一天中什么时候应该停放出租车以供租用!
通过传统的处理方式很难处理Bigdata。它可能需要在数十,数百甚至数千台服务器上运行的大规模并行软件。对于像Google和Apple这样的大型组织来说,设置这样的服务器集群可能是可行的,但它不适合较小的玩家。但随后商品硬件,云架构和社区驱动的开源软件的发展也将Bigdata处理带入了较小的处理范围。对于即使是创业公司来说,Bigdata处理也变得越来越可行,他们可以简单地在云中租用服务器时间,而不是建立自己的服务器房间而不是。
Bigdata的进步每天影响我们!无论是Facebook上的“朋友建议”还是Google上的“个性化广告”。行业不断挖掘数据(实际上是The Bigdata),以提供高度个性化的用户体验,同时创建一种新的广告业务,广告商在手边知道您需要购买的东西!
所以,你去了很多Bigdata的实际例子。
来源:bigdataspeak