嗨,
以下是我们的情景,请提供可能的解决方案,
我们有一个现有的报告解决方案(SAP)在RDBMS中执行过程(使用JDBC Connection),以根据用户输入生成报告。
现在我们计划从RDBMS迁移到hive作为我们的数据源。
有没有办法连接到hive并使用JDBC连接执行过程(HPLSQL或执行Oracle过程的等效作业的UDF)?
或者是否有任何其他方法可以使用jdbc在hive或spark中运行过程或程序? 感谢
答案 0 :(得分:1)
可以使用JDBC
连接到Hivehttps://cwiki.apache.org/confluence/display/Hive/HiveClient#HiveClient-JDBC
但是,如果您的群集是安全的,则需要连接到HiveServer2
https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC
另外,Hive从2.0.0版本支持存储过程