在群集上,我为每个用户提供了60GB的Hadoop配额。 从历史上看,我正在开发的项目会产生大量的Hive查询。 为了使事情更快地工作,我试图并行这些查询(这些查询是无关的),但结果是目录/user/ {myusername} / .staging/正在填充job_ {someid}目录,而这些目录又是充满了蜂巢罐,消耗这些60GB非常快。虽然我可以限制并行化因素,但我还想看看我是否可以让Hive将这些jar放在不同的目录中。说/ tmp / {myusername}我有更多的空间。
我知道如何告诉Hive / Beeline在/ tmp / {myusername}下创建.staging目录?
答案 0 :(得分:0)
最简单的方法是执行您的直线会话。
beeline --hive.exec.stagingdir=/tmp/{myusername}
认为你可以通过以下方式进行操作!设置内线直线但不具备可用的语法。
答案 1 :(得分:0)
上述方法无效。
我们发现以下工作
beeline --hiveconf hive.exec.stagingdir = / tmp / {myusername}