我听说Hadoop准备取代数据仓库的报道。所以我想知道是否有成功/失败率的实际案例研究,或者是否有一些开发人员在这个项目中完成或部分工作?
随着“大数据”的出现,似乎有很多炒作,我试图从小说中找出事实。
我们正在进行大规模的数据库转换,我认为这可能是另一种解决方案。
答案 0 :(得分:1)
好的,大数据创业公司有很多成功案例,特别是在AdTech,虽然它不是“替换”旧的昂贵的专有方式,但他们只是第一次使用Hadoop。我想这是一个创业公司的好处 - 没有遗留系统。从技术和数据科学的角度来看,广告虽然有点无聊,但却非常有趣。数据量巨大,挑战在于如何更有效地细分用户并为广告空间出价。这通常意味着涉及一些机器学习。
不仅仅是AdTech,Hadoop还被银行用于欺诈检测和各种其他交易分析。
所以我的两分钱为什么会发生这种情况我将尝试总结我的主要经验,即使用HDFS与Spark和Scala,以及使用SAS,R& S的传统方法。 Teradata的:
这四点结合起来意味着A:存储数据现在便宜很多,B:现在处理数据便宜很多C:人力资源成本便宜得多,因为现在你不需要几个团队孤立进入分析师,建模人员,工程师,开发人员之后,你可以将这些技能混合在一起,使混合动力车最终需要雇佣更少的人。
事情不会在一夜之间发生变化,目前劳动力市场主要缺少两个群体;优秀的大数据DevOps和Scala工程师/开发人员,他们的费率清楚地反映了这一点。不幸的是,即使需求非常高,供应也很低。虽然我仍然认为Hadoop的仓储要便宜得多,但找到人才可能是一个很大的成本,限制了转型的步伐。