Hive / Beeline,如何设置作业。暂存目录?

时间:2016-06-19 15:27:35

标签: hadoop hive beeline

在群集上,我为每个用户提供了60GB的Hadoop配额。 从历史上看,我正在开发的项目会产生大量的Hive查询。 为了使事情更快地工作,我试图并行这些查询(这些查询是无关的),但结果是目录/user/ {myusername} / .staging/正在填充job_ {someid}目录,而这些目录又是充满了蜂巢罐,消耗这些60GB非常快。虽然我可以限制并行化因素,但我还想看看我是否可以让Hive将这些jar放在不同的目录中。说/ tmp / {myusername}我有更多的空间。

我知道如何告诉Hive / Beeline在/ tmp / {myusername}下创建.staging目录?

2 个答案:

答案 0 :(得分:0)

最简单的方法是执行您的直线会话。

beeline --hive.exec.stagingdir=/tmp/{myusername}

认为你可以通过以下方式进行操作!设置内线直线但不具备可用的语法。

答案 1 :(得分:0)

上述方法无效。

我们发现以下工作

beeline --hiveconf hive.exec.stagingdir = / tmp / {myusername}