如何为Hive自定义UDF添加JAR,以便它在HDInsight群集上永久可用?

时间:2016-07-22 01:06:46

标签: hive hdinsight

我在Hive中创建了一个自定义UDF,它在Hive命令行中测试过,运行正常。那么现在我有UDF的jar文件,我需要做什么才能让用户能够创建指向它的临时函数?理想情况下,从Hive的命令提示符我会这样做: -

hive> add jar myudf.jar;
Added [myudf.jar] to class path
Added resources: [myudf.jar]
hive> create temporary function foo as 'mypackage.CustomUDF';

在此之后,我能够正确使用该功能。

但我不希望每次想要执行该功能时都添加jar。我应该能够在以下情况下运行此功能: -

  1. 从Visual Studio
  2. 对HDInsight群集执行Hive查询
  3. 通过SSH(Linux)或命令行从命令行执行Hive查询 RDP / CMD(Windows)中
  4. 从Ambari(Linux)Hive视图执行Hive查询
  5. 从HDinsight查询控制台Hive执行Hive查询 编辑器(Windows群集)
  6. 因此,无论我如何执行查询,JAR都应该已经可用并添加到路径中。确保Linux和Windows群集的过程是什么?

1 个答案:

答案 0 :(得分:1)

可能是你可以在hive etc / conf目录中的hiverc文件中添加jar。每次启动配置单元时都会加载此文件。所以从下次开始你不需要为该会话分别添加jar。