我已经建立了Hadoop 2.6的单节点集群,但我需要将zookeeper和hbase集成在一起。 我是初学者,没有大数据工具的经验。 你如何设置zookeeper来协调hadoop集群?我们如何在hdfs上使用hbase? 他们如何结合起来构建生态系统?
答案 0 :(得分:0)
对于独立模式,只需按照此HBase指南中提供的步骤操作:http://hbase.apache.org/book.html#quickstart
HBase具有独立模式,可让初学者轻松上手。在独立模式下,hbase,hdfs和zk在单个JVM进程中运行。
答案 1 :(得分:0)
这取决于您要构建的系统类型。正如您所说,Hadoop生态系统是我的三个主要组件:HBase,HDFS和zookeeper。虽然它们可以彼此独立安装,但有时根据您要设置的群集类型,无需安装它们。
由于您使用的是单节点群集,因此您可以选择两种HBase运行模式:独立模式和伪分布式模式。在独立模式下,无需安装HDFS或Zookeeper。 HBase将以透明的方式完成所有工作。如果要使用伪分布式模式,可以针对本地文件系统或针对HDFS运行HBase。如果要使用HDFS,则必须安装Hadoop。关于动物园管理员,HBase也将自己完成这项工作(你只需通过配置文件告诉他)。
如果您想在伪分布式模式下使用HDFS,下载Hadoop将获得HDFS和MapReduce。如果您不想执行MapReduce作业,请忽略其工具。
如果您想了解更多信息,我认为本指南非常清楚地解释了这一点:https://hbase.apache.org/book.html(检查HBase运行模式)。