我有从不同群集读取Hive源表的要求-我正在尝试研究如何实现此目标?我打算将HiveServer2(JDBC)连接用作选项。有人可以向我介绍一些示例代码或一些参考URL。
我尝试使用“ hive-jdbc.jar”,在下面的代码段中,它打印了printsSchema,但是与Show()方法一起使用时会失败。
val jdbcDF = spark.read
.format("jdbc")
.option("url", "jdbc:hive2://34.223.237.55:10000")
.option("dbtable", "students1")
.option("user", "hduser")
.option("password", "hadoop")
.option("fetchsize", "20")
.load()
注意:Hive已被kerberized
感谢您提供任何帮助。
谢谢
引用问题: