我想在我的Ubuntu上安装Hive。我读了this文章,这对我很有帮助。我做了除步骤4以外的所有步骤。我不明白这一步应该做什么。< / p> 你可以详细解释一下这个步骤吗?
答案 0 :(得分:5)
第1步:下载并解压缩Hadoop
步骤2:将JAVA_HOME路径设置为conf / hadoop-env.sh //这一步是为hadoop设置java路径
第3步:conf / core-site.xml:
<configuration>
<property>
<name>fs.default.name</name> //Place your home folder here for using hadoop
<value>hdfs://localhost:9000</value>
</property>
</configuration>
第4步:conf / hdfs-site.xml:
<configuration> //This setting for the number of replications of the file or you can add data node for the save the file
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
第5步:conf / mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value> // add your master host in the place of localhost here
</property>
</configuration>
步骤6:登录SSH localhost并格式化新的分布式文件系统
bin/hadoop namenode -format
步骤7:启动hadoop守护进程:
bin/start-all.sh
步骤8:检查NameNode&amp; JobTracker在端口
下面http://localhost:50070/ //master
http://localhost:50030/ //slave
//最好还是尝试使用ssh来检查你的工作节点
第9步:下载并提取Hive
步骤10:在Env变量下面设置。
export HADOOP_HOME=<hadoop-install-dir>
export HIVE_HOME=<hive-install-dir>
export PATH=$HIVE_HOME/bin:$PATH
$HIVE_HOME/bin/hive
答案 1 :(得分:2)
步骤#3顺便进行了吗?到第3步,您将从SVN下载二进制文件到您的计算机,第4步是使用您的Hadoop环境设置二进制文件。
第4步建议您:
export PATH = $ PATH:/ usr / src / hive / build / dist / bin /
- &GT;表示您在PATH环境中添加目录/ usr / src / hive / build / dist / bin /。您必须在此文件夹中安装了配置单元 - &gt; / usr / src / hive / build / dist / bin /所以在你的路径中添加这个文件夹(实际是Hive二进制文件)可以让你在你的机器上运行Hive。
export PATH = $ PATH:/ usr / src / hive / build / dist / lib /
- &GT;表示您在PATH环境中添加目录/ usr / src / hive / build / dist / lib /。在计算机上安装Hive后,Hive相关库位于此文件夹中&gt; / usr / src / hive / build / dist / lib /所以将此目录添加到PATH中,将有助于Hive成功运行。
export PATH = $ PATH:/ usr / local / hadoop / bin
- &GT;如果你已经在你的机器上运行了Hadoop,那么这应该已经设置,否则这个命令只是在机器路径中设置Hadoop Binary文件夹。
如果您不知道什么是PATH,只需在互联网上查找“Linux中的路径”。
答案 2 :(得分:0)
This PPA使得在Ubuntu上安装Hive非常容易。