学习Hadoop for System Admin

时间:2014-01-10 21:05:11

标签: hadoop

这不是一个技术问题,但希望得到更有经验的人对我职业生涯的建议。 在过去的13年里,我一直在以UNIX管理员身份工作,大部分是Solaris,在Linux上工作了几年。现在,我想学习更多能够超越我职业生涯的东西。从很长一段时间以来,我一直听到很多关于Hadoop /大数据的消息。我没有任何编程或脚本知识,也没有apache或任何数据库的知识。 - 我假设有两个不同的工作档案,开发人员和管理员。我理解正确吗? - 我是否需要学习apache,数据库,java来学习Hadoop(即使是管理员职位简介)? - 在我的地方训练费用很高。如果我想开始学习书籍,我应该从哪本书入手?我可以看到流行的是“Hadoop:The Definite Guide - O'Reilly”以及“Dummies的大数据”。 (我是从初学者层面问的。)

请帮助我的疑虑。您的建议将帮助我做出决定。

1 个答案:

答案 0 :(得分:0)

(由于评论太长,所以感动了。)

为了以任何有意义的方式管理Hadoop,您需要了解(a)Hadoop如何工作,(b)Hadoop如何运行其作业,以及(c)特定于作业的调整。

我不知道“学习Apache”是什么意思; Apache是​​一个项目集团,除非你的意思是Web服务器本身。

“学习数据库”太宽泛而无用,Hadoop不是数据库(HBase是)。

您不需要任何Java知识来管理基于Java的程序,尽管了解JVM选项,如何指定它们以及通用性肯定是有帮助的。

有一个很多要消化,我会从很小的开始,例如介绍书。另外,请记住,除了 Hadoop之外还有其他解决方案以及实际使用 Hadoop的许多不同方法。

The Kiji project是让Hadoop / HBase /等启动并运行的好方法,但如果你有兴趣“从头开始”做所有事情,那么这不是最佳途径。